Google Poi Crawler

noodles 19f1b843af md_edit hace 2 años
result 5444ae2209 url_list hace 3 años
utility 8719bd91d8 w hace 2 años
HKS須重爬店家.csv 73f7dbb91c e hace 2 años
README.md 19f1b843af md_edit hace 2 años
category.csv e1c01538c6 w hace 3 años
details.xls 351f83b5b0 w hace 2 años
get_google_id.py cb1ac6f6f2 'edit' hace 2 años
hot_pot.xls 351f83b5b0 w hace 2 años
jared_pureselenium_shop_item_list.py fd9129d878 w hace 3 años
jared_run.py e2dab507f9 test hace 2 años
jared_shop_item_list.py e2dab507f9 test hace 2 años
lat_long_location.csv b696670aac 上傳檔案到 '' hace 3 años
lat_long_search.py b696670aac 上傳檔案到 '' hace 3 años
linux_loop.sh 976f9dc15c w hace 2 años
location_list.csv b696670aac 上傳檔案到 '' hace 3 años
loop_5555.bat 14b721db42 w hace 2 años
loop_6666.bat 14b721db42 w hace 2 años
loop_rep.py e944b9e077 w hace 2 años
loop_storelist.bat cb9bffedba w hace 2 años
run.py 351f83b5b0 w hace 2 años
run2.py 2296d4de40 edit hace 3 años
run3.py 72e5d14360 w hace 2 años
run4.py e8fec9375a w hace 2 años
run5.py 6010d36566 e hace 2 años
shop_item_list.py 295a356f5b w hace 2 años
start.sh 5e08212582 edit hace 3 años
swire_docker_itemlist.py 67186b0079 w hace 2 años
swire_shop_item_list.py 1abe606703 w hace 2 años
swire_shop_review.py 52632418ca review_update hace 2 años

README.md

GooglePoiCrawler

Google Poi Crawler

Reviews crawler

Code : swire_shop_review.py Execute:

python swire_shop_review.py [port] [proxyport]

DB information

swire_store_list(line 103): store shop list reviews_table(line 232): store crawler result, use Function save_js_to_db to save parsing data into database

db_columns = ['author_id','author_page','author_name', 'author_image','author_review_count','review_time','review_content','review_image','store_review_time','store_review'] review_process (line 271): store cralwer status

Crawler list

Function get_next_job (line 98): get shop list, data column need ==shop url== (code called item_url), ==fid==, ==shop rating counts== (code called user_ratings_total)

Use ==fid== as all db key

Page down function

Function get_reviews (line 205): Check if the store has reviews first and use shop rating countsdivided by three as page down counts.