hhh_fetch_gap20.py 10 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275
  1. from typing import NoReturn
  2. from selenium import webdriver
  3. import time
  4. import networkx as nx
  5. import dataset
  6. import pickle
  7. import codecs
  8. from selenium.webdriver.common import keys
  9. from selenium.webdriver.common.keys import Keys
  10. import sys
  11. import os
  12. import time
  13. import re
  14. import pandas as pd
  15. import df2sheet
  16. from browser_common import JBrowser
  17. import datetime
  18. import dataset
  19. db = dataset.connect('mysql://choozmo:pAssw0rd@db.ptt.cx:3306/hhh?charset=utf8mb4')
  20. table=db['gap20v7']
  21. def find_master_by_designer(masters,designer):
  22. for m in masters:
  23. if m['designer']==designer:
  24. return m
  25. def get_designer_statistics(kw):
  26. global db
  27. global table
  28. jb=JBrowser()
  29. jb.set_profile_path("Profile 7")
  30. details=[]
  31. masters=[]
  32. if True:
  33. googleurl='https://www.google.com/search?q='+kw
  34. jb.get(googleurl)
  35. driver=jb.get_driver()
  36. time.sleep(3)
  37. # elmts=driver.find_elements_by_xpath("//div[@class='g']//div[@class='yuRUbf']//a")
  38. elmts=driver.find_elements_by_xpath("//div[@class='TbwUpd NJjxre']/cite")
  39. # print(elmts)
  40. # time.sleep(9999)
  41. idx=1
  42. ranking=-1
  43. searchhome=-1
  44. hhh=-1
  45. com100=-1
  46. txt=None
  47. href=None
  48. for elmt in elmts:
  49. # href=elmt.get_attribute('href')
  50. elmt_titl3=elmt.find_element_by_xpath("../..//h3")
  51. elmt_href=elmt.find_element_by_xpath("../..")
  52. # elmt_href=elmt_titl3.find_element_by_xpath("..")
  53. print(elmt_titl3.text)
  54. print(elmt_href.text)
  55. print(elmt_href.get_attribute('href'))
  56. table.insert({'title':elmt_titl3.text,'href':elmt_href.get_attribute('href'),'kw':kw.replace(' site:hhh.com.tw','')})
  57. txt=elmt_titl3.text
  58. href=elmt_href.text
  59. # time.sleep(9999)
  60. # if len(txt)>2:
  61. if not ('google.com' in href):
  62. if '100.com' in href:
  63. com100=idx
  64. if 'searchome' in href:
  65. searchhome=idx
  66. if 'hhh.com.tw' in href:
  67. print(href)
  68. print(href)
  69. print(txt)
  70. idx+=1
  71. # time.sleep(9999)
  72. time.sleep(3)
  73. qlist=[]
  74. #get_designer_statistics("化妝 台 設計 site:hhh.com.tw")
  75. #get_designer_statistics("油漆 顏色 site:hhh.com.tw")
  76. #get_designer_statistics("牆壁 裝飾 site:hhh.com.tw")
  77. #get_designer_statistics("主 臥室 設計 site:hhh.com.tw")
  78. #get_designer_statistics("套房 裝潢 site:hhh.com.tw")
  79. #get_designer_statistics("商業 空間 設計 site:hhh.com.tw")
  80. #get_designer_statistics("台南 室內 設計 site:hhh.com.tw")
  81. #get_designer_statistics("電視 牆 設計 作品 site:hhh.com.tw")
  82. #get_designer_statistics("臥室 裝潢 site:hhh.com.tw")
  83. get_designer_statistics("衛浴 設計 site:hhh.com.tw")
  84. #get_designer_statistics("北歐 風 site:hhh.com.tw")
  85. #get_designer_statistics("設計 site:hhh.com.tw")
  86. #get_designer_statistics("工業 風 site:hhh.com.tw")
  87. #get_designer_statistics("客厅 設計 site:hhh.com.tw")
  88. #get_designer_statistics("衣櫃 設計 site:hhh.com.tw")
  89. #get_designer_statistics("室內 設計 師 site:hhh.com.tw")
  90. #get_designer_statistics("天花板 設計 site:hhh.com.tw")
  91. #get_designer_statistics("平面 設計 圖 site:hhh.com.tw")
  92. #get_designer_statistics("天花板 裝潢 site:hhh.com.tw")
  93. #get_designer_statistics("2 坪 小 房間 佈置 site:hhh.com.tw")
  94. #get_designer_statistics("浴室 裝潢 site:hhh.com.tw")
  95. #get_designer_statistics("推薦 室內 設計 師 site:hhh.com.tw")
  96. #get_designer_statistics("設計 圖 site:hhh.com.tw")
  97. #get_designer_statistics("台北 室內 設計 師 site:hhh.com.tw")
  98. #get_designer_statistics("工業 風 天花板 site:hhh.com.tw")
  99. #get_designer_statistics("店面 設計 site:hhh.com.tw")
  100. #get_designer_statistics("廁所 裝潢 site:hhh.com.tw")
  101. #get_designer_statistics("建築 設計 site:hhh.com.tw")
  102. #get_designer_statistics("油漆 顏色 site:hhh.com.tw")
  103. #get_designer_statistics("牆壁 裝飾 site:hhh.com.tw")
  104. #get_designer_statistics("室內 設計 apps site:hhh.com.tw")
  105. #get_designer_statistics("住宅 空間 設計 apps site:hhh.com.tw")
  106. #get_designer_statistics("住宅 設計 site:hhh.com.tw")
  107. #get_designer_statistics("衛浴 設計 site:hhh.com.tw")
  108. #get_designer_statistics("牆 面 設計 site:hhh.com.tw")
  109. #get_designer_statistics("小 浴室 設計 實例 site:hhh.com.tw")
  110. #get_designer_statistics("文化 石 牆 site:hhh.com.tw")
  111. #get_designer_statistics("愛 菲 爾 系統 家具 site:hhh.com.tw")
  112. #get_designer_statistics("泥 作 site:hhh.com.tw")
  113. #get_designer_statistics("推薦 室內 設計 site:hhh.com.tw")
  114. #get_designer_statistics("住家 設計 site:hhh.com.tw")
  115. #get_designer_statistics("設計 100 site:hhh.com.tw")
  116. #get_designer_statistics("台北 推薦 室內 設計 site:hhh.com.tw")
  117. #get_designer_statistics("台北 推薦 室內 設計 師 site:hhh.com.tw")
  118. #get_designer_statistics("浴室 裝修 site:hhh.com.tw")
  119. #get_designer_statistics("近 境 製作 site:hhh.com.tw")
  120. #get_designer_statistics("北歐 風格 site:hhh.com.tw")
  121. #get_designer_statistics("1 坪 浴室 設計 site:hhh.com.tw")
  122. #get_designer_statistics("裝修 site:hhh.com.tw")
  123. #get_designer_statistics("室內 設計 平面圖 site:hhh.com.tw")
  124. #get_designer_statistics("好 室 設計 site:hhh.com.tw")
  125. #get_designer_statistics("系統 家具 推薦 site:hhh.com.tw")
  126. #get_designer_statistics("店面 裝潢 site:hhh.com.tw")
  127. #get_designer_statistics("系統 櫃 設計 site:hhh.com.tw")
  128. #get_designer_statistics("神明 廳 設計 site:hhh.com.tw")
  129. #get_designer_statistics("工業 風 客廳 site:hhh.com.tw")
  130. #get_designer_statistics("房間 顏色 site:hhh.com.tw")
  131. #get_designer_statistics("輕 裝潢 site:hhh.com.tw")
  132. #get_designer_statistics("大雄 設計 site:hhh.com.tw")
  133. #get_designer_statistics("透 天 客廳 裝潢 site:hhh.com.tw")
  134. #get_designer_statistics("房間 油漆 site:hhh.com.tw")
  135. #get_designer_statistics("衣櫃 設計 圖 site:hhh.com.tw")
  136. #get_designer_statistics("小 店面 設計 site:hhh.com.tw")
  137. #get_designer_statistics("小坪 數 浴室 設計 site:hhh.com.tw")
  138. #get_designer_statistics("辦公室 裝潢 site:hhh.com.tw")
  139. #get_designer_statistics("簡約 工業 風 site:hhh.com.tw")
  140. #get_designer_statistics("簡約 風 site:hhh.com.tw")
  141. #get_designer_statistics("室內 平面 設計 圖 site:hhh.com.tw")
  142. #get_designer_statistics("室內 平面圖 site:hhh.com.tw")
  143. #get_designer_statistics("臥室 佈置 site:hhh.com.tw")
  144. #get_designer_statistics("現代 神明 桌 site:hhh.com.tw")
  145. #get_designer_statistics("層 板 設計 site:hhh.com.tw")
  146. #get_designer_statistics("臥榻 設計 site:hhh.com.tw")
  147. #get_designer_statistics("牆壁 顏色 site:hhh.com.tw")
  148. #get_designer_statistics("居家 布置 site:hhh.com.tw")
  149. #get_designer_statistics("夾層 設計 site:hhh.com.tw")
  150. #get_designer_statistics("安 德 康 site:hhh.com.tw")
  151. #get_designer_statistics("小坪 數 套房 設計 site:hhh.com.tw")
  152. #get_designer_statistics("無印 風 裝潢 site:hhh.com.tw")
  153. #get_designer_statistics("小坪 數 房間 改造 site:hhh.com.tw")
  154. #get_designer_statistics("小坪 數 浴室 設計 site:hhh.com.tw")
  155. #get_designer_statistics("居家 佈置 site:hhh.com.tw")
  156. #get_designer_statistics("小 房間 改造 site:hhh.com.tw")
  157. #get_designer_statistics("辦公室 裝潢 site:hhh.com.tw")
  158. #get_designer_statistics("小坪 數 中島 廚房 site:hhh.com.tw")
  159. #get_designer_statistics("臥室 布置 site:hhh.com.tw")
  160. #get_designer_statistics("3 坪 房間 設計 site:hhh.com.tw")
  161. #get_designer_statistics("mobile01 裝潢 site:hhh.com.tw")
  162. #get_designer_statistics("台中 系統 櫃 site:hhh.com.tw")
  163. #get_designer_statistics("設計 工作 室 site:hhh.com.tw")
  164. #get_designer_statistics("家具 設計 site:hhh.com.tw")
  165. #get_designer_statistics("小坪 數 房間 裝潢 site:hhh.com.tw")
  166. #get_designer_statistics("工作 室 設計 site:hhh.com.tw")
  167. #get_designer_statistics("建築 設計 圖 site:hhh.com.tw")
  168. #get_designer_statistics("小 房間 裝潢 site:hhh.com.tw")
  169. #get_designer_statistics("小 玄 關 設計 site:hhh.com.tw")
  170. #get_designer_statistics("布置 房間 site:hhh.com.tw")
  171. #get_designer_statistics("傢俱 設計 site:hhh.com.tw")
  172. #get_designer_statistics("北歐 風 臥室 site:hhh.com.tw")
  173. #get_designer_statistics("地板 磁 磚 價格 site:hhh.com.tw")
  174. #get_designer_statistics("地板 磁 磚 價格 site:hhh.com.tw")
  175. #get_designer_statistics("l 型 廚房 site:hhh.com.tw")
  176. #get_designer_statistics("佈置 房間 site:hhh.com.tw")
  177. #get_designer_statistics("小坪 數 房間 site:hhh.com.tw")
  178. #get_designer_statistics("房間 風格 site:hhh.com.tw")
  179. #get_designer_statistics("嘉義 室內 設計 site:hhh.com.tw")
  180. #get_designer_statistics("無印 風 客廳 site:hhh.com.tw")
  181. #get_designer_statistics("牆 面 裝飾 site:hhh.com.tw")
  182. #get_designer_statistics("臥榻 櫃 site:hhh.com.tw")
  183. #get_designer_statistics("工業 風 辦公室 site:hhh.com.tw")
  184. #get_designer_statistics("小坪 數 浴室 乾 濕 分離 site:hhh.com.tw")
  185. #get_designer_statistics("電視 牆 收納 櫃 site:hhh.com.tw")
  186. #get_designer_statistics("拉 門 site:hhh.com.tw")
  187. #get_designer_statistics("房間 佈置 site:hhh.com.tw")
  188. #get_designer_statistics("房間 布置 site:hhh.com.tw")
  189. #get_designer_statistics("臥榻 site:hhh.com.tw")
  190. #get_designer_statistics("卧榻 site:hhh.com.tw")
  191. #get_designer_statistics("廚房 吊 櫃 site:hhh.com.tw")
  192. #get_designer_statistics("浴室 設計 site:hhh.com.tw")
  193. #get_designer_statistics("廁所 設計 site:hhh.com.tw")
  194. #get_designer_statistics("中島 廚房 site:hhh.com.tw")
  195. #get_designer_statistics("裝潢 費用 site:hhh.com.tw")
  196. #get_designer_statistics("小 房間 設計 site:hhh.com.tw")
  197. #get_designer_statistics("北歐 風 客廳 site:hhh.com.tw")
  198. #get_designer_statistics("小坪 數 房間 設計 site:hhh.com.tw")
  199. #get_designer_statistics("鞋 柜 設計 site:hhh.com.tw")
  200. #get_designer_statistics("餐廳 設計 site:hhh.com.tw")
  201. #get_designer_statistics("拉 門 設計 site:hhh.com.tw")
  202. #get_designer_statistics("毛坯 屋 site:hhh.com.tw")
  203. #get_designer_statistics("辦公室 設計 site:hhh.com.tw")
  204. #get_designer_statistics("毛玻璃 拉 門 site:hhh.com.tw")
  205. #get_designer_statistics("鞋 櫃 設計 site:hhh.com.tw")
  206. #get_designer_statistics("床 頭 衣櫃 設計 site:hhh.com.tw")
  207. #get_designer_statistics("透 天 裝潢 site:hhh.com.tw")
  208. #get_designer_statistics("屏風 設計 site:hhh.com.tw")
  209. #get_designer_statistics("隔 間 拉 門 site:hhh.com.tw")
  210. #get_designer_statistics("玻璃 隔 間 site:hhh.com.tw")
  211. #get_designer_statistics("玻璃 隔 間 site:hhh.com.tw")