Bläddra i källkod

Merge branch 'master' of http://git.choozmo.com:3000/choozmo/kw_tools

Jared 3 år sedan
förälder
incheckning
898dce6e1d
2 ändrade filer med 41 tillägg och 0 borttagningar
  1. 41 0
      choozmo/googlenews.py
  2. 0 0
      ig_tags/link.txt

+ 41 - 0
choozmo/googlenews.py

@@ -0,0 +1,41 @@
+from newspaper import Article
+from GoogleNews import GoogleNews
+
+
+def news(title_and_link):
+    for i in title_and_link:
+        article = Article(i['link'])
+        article.download()
+        article.parse()
+        text = article.text
+        title = i['title']
+        try:
+            with open(f'/googlenews/{title}.txt', 'x') as f:
+                f.write(text)
+        except FileExistsError:
+            print('已有同樣新聞文章')
+            pass
+    return text
+
+
+def google_news(keyword, page):
+    g = GoogleNews()
+    g.setlang('cn')
+    g.setencode('utf-8')
+    g.search(keyword)
+    g.clear()
+    news_link = []
+    for i in range(page):
+        g.get_page(page)
+        result = g.result()
+        for j in result:
+            d = {'title': j['title'], 'link': j['link']}
+            news_link.append(d)
+    g.clear()
+    print(len(news_link))
+    print(news_link)
+    return news_link
+
+
+result = google_news('地震', 1)
+news(result)

Filskillnaden har hållts tillbaka eftersom den är för stor
+ 0 - 0
ig_tags/link.txt


Vissa filer visades inte eftersom för många filer har ändrats