Google Poi Crawler

noodles 19f1b843af md_edit пре 2 година
result 5444ae2209 url_list пре 3 година
utility 8719bd91d8 w пре 2 година
HKS須重爬店家.csv 73f7dbb91c e пре 2 година
README.md 19f1b843af md_edit пре 2 година
category.csv e1c01538c6 w пре 3 година
details.xls 351f83b5b0 w пре 2 година
get_google_id.py cb1ac6f6f2 'edit' пре 2 година
hot_pot.xls 351f83b5b0 w пре 2 година
jared_pureselenium_shop_item_list.py fd9129d878 w пре 3 година
jared_run.py e2dab507f9 test пре 2 година
jared_shop_item_list.py e2dab507f9 test пре 2 година
lat_long_location.csv b696670aac 上傳檔案到 '' пре 3 година
lat_long_search.py b696670aac 上傳檔案到 '' пре 3 година
linux_loop.sh 976f9dc15c w пре 2 година
location_list.csv b696670aac 上傳檔案到 '' пре 3 година
loop_5555.bat 14b721db42 w пре 2 година
loop_6666.bat 14b721db42 w пре 2 година
loop_rep.py e944b9e077 w пре 2 година
loop_storelist.bat cb9bffedba w пре 2 година
run.py 351f83b5b0 w пре 2 година
run2.py 2296d4de40 edit пре 3 година
run3.py 72e5d14360 w пре 2 година
run4.py e8fec9375a w пре 2 година
run5.py 6010d36566 e пре 2 година
shop_item_list.py 295a356f5b w пре 2 година
start.sh 5e08212582 edit пре 3 година
swire_docker_itemlist.py 67186b0079 w пре 2 година
swire_shop_item_list.py 1abe606703 w пре 2 година
swire_shop_review.py 52632418ca review_update пре 2 година

README.md

GooglePoiCrawler

Google Poi Crawler

Reviews crawler

Code : swire_shop_review.py Execute:

python swire_shop_review.py [port] [proxyport]

DB information

swire_store_list(line 103): store shop list reviews_table(line 232): store crawler result, use Function save_js_to_db to save parsing data into database

db_columns = ['author_id','author_page','author_name', 'author_image','author_review_count','review_time','review_content','review_image','store_review_time','store_review'] review_process (line 271): store cralwer status

Crawler list

Function get_next_job (line 98): get shop list, data column need ==shop url== (code called item_url), ==fid==, ==shop rating counts== (code called user_ratings_total)

Use ==fid== as all db key

Page down function

Function get_reviews (line 205): Check if the store has reviews first and use shop rating countsdivided by three as page down counts.