소스 검색

Merge branch 'master' of http://git.choozmo.com:3000/choozmo/kw_tools

Jared 3 년 전
부모
커밋
898dce6e1d
2개의 변경된 파일41개의 추가작업 그리고 0개의 파일을 삭제
  1. 41 0
      choozmo/googlenews.py
  2. 0 0
      ig_tags/link.txt

+ 41 - 0
choozmo/googlenews.py

@@ -0,0 +1,41 @@
+from newspaper import Article
+from GoogleNews import GoogleNews
+
+
+def news(title_and_link):
+    for i in title_and_link:
+        article = Article(i['link'])
+        article.download()
+        article.parse()
+        text = article.text
+        title = i['title']
+        try:
+            with open(f'/googlenews/{title}.txt', 'x') as f:
+                f.write(text)
+        except FileExistsError:
+            print('已有同樣新聞文章')
+            pass
+    return text
+
+
+def google_news(keyword, page):
+    g = GoogleNews()
+    g.setlang('cn')
+    g.setencode('utf-8')
+    g.search(keyword)
+    g.clear()
+    news_link = []
+    for i in range(page):
+        g.get_page(page)
+        result = g.result()
+        for j in result:
+            d = {'title': j['title'], 'link': j['link']}
+            news_link.append(d)
+    g.clear()
+    print(len(news_link))
+    print(news_link)
+    return news_link
+
+
+result = google_news('地震', 1)
+news(result)

파일 크기가 너무 크기때문에 변경 상태를 표시하지 않습니다.
+ 0 - 0
ig_tags/link.txt


이 변경점에서 너무 많은 파일들이 변경되어 몇몇 파일들은 표시되지 않았습니다.