Google Poi Crawler

noodles 19f1b843af md_edit vor 2 Jahren
result 5444ae2209 url_list vor 3 Jahren
utility 8719bd91d8 w vor 2 Jahren
HKS須重爬店家.csv 73f7dbb91c e vor 2 Jahren
README.md 19f1b843af md_edit vor 2 Jahren
category.csv e1c01538c6 w vor 3 Jahren
details.xls 351f83b5b0 w vor 2 Jahren
get_google_id.py cb1ac6f6f2 'edit' vor 2 Jahren
hot_pot.xls 351f83b5b0 w vor 2 Jahren
jared_pureselenium_shop_item_list.py fd9129d878 w vor 3 Jahren
jared_run.py e2dab507f9 test vor 2 Jahren
jared_shop_item_list.py e2dab507f9 test vor 2 Jahren
lat_long_location.csv b696670aac 上傳檔案到 '' vor 3 Jahren
lat_long_search.py b696670aac 上傳檔案到 '' vor 3 Jahren
linux_loop.sh 976f9dc15c w vor 2 Jahren
location_list.csv b696670aac 上傳檔案到 '' vor 3 Jahren
loop_5555.bat 14b721db42 w vor 2 Jahren
loop_6666.bat 14b721db42 w vor 2 Jahren
loop_rep.py e944b9e077 w vor 2 Jahren
loop_storelist.bat cb9bffedba w vor 2 Jahren
run.py 351f83b5b0 w vor 2 Jahren
run2.py 2296d4de40 edit vor 3 Jahren
run3.py 72e5d14360 w vor 2 Jahren
run4.py e8fec9375a w vor 2 Jahren
run5.py 6010d36566 e vor 2 Jahren
shop_item_list.py 295a356f5b w vor 2 Jahren
start.sh 5e08212582 edit vor 3 Jahren
swire_docker_itemlist.py 67186b0079 w vor 2 Jahren
swire_shop_item_list.py 1abe606703 w vor 2 Jahren
swire_shop_review.py 52632418ca review_update vor 2 Jahren

README.md

GooglePoiCrawler

Google Poi Crawler

Reviews crawler

Code : swire_shop_review.py Execute:

python swire_shop_review.py [port] [proxyport]

DB information

swire_store_list(line 103): store shop list reviews_table(line 232): store crawler result, use Function save_js_to_db to save parsing data into database

db_columns = ['author_id','author_page','author_name', 'author_image','author_review_count','review_time','review_content','review_image','store_review_time','store_review'] review_process (line 271): store cralwer status

Crawler list

Function get_next_job (line 98): get shop list, data column need ==shop url== (code called item_url), ==fid==, ==shop rating counts== (code called user_ratings_total)

Use ==fid== as all db key

Page down function

Function get_reviews (line 205): Check if the store has reviews first and use shop rating countsdivided by three as page down counts.