报纸(Python)获取所有cnn新闻url

文章/答案/技术大牛

发布

2回答

python、html、python-newspaper

例如，在此url ()中<div class="cnn-search__result-thumbnail"> <img

浏览 19提问于2018-08-02得票数 0

2回答

报纸图书馆

python、python-newspaper

作为一个关于使用python这个话题的新手，我在使用报纸库扩展时遇到了一些困难。我的目标是定期使用报纸扩展，下载一个名为"tagesschau“的德国新闻网站的所有新文章，以及CNN的所有文章，以建立一个我可以在几年内分析的数据堆栈。如果我做对了，我可以使用以下命令将所有文章下载并刮到python库中。=2) # (3*2) = 6 threads total如果这是下载所有</

浏览 0提问于2018-11-13得票数 3

回答已采纳

1回答

Python报库结果不一致？

python、python-newspaper

我使用的是Anaconda3，安装了报纸。看起来很简单，但结果并不一致。import newspaperfor article in cnn_paper.articles:print(article.url)这段简单的代码有时返回所有结果，有时不返回任何结果。有没有人用过这个库或者

浏览 11提问于2017-12-16得票数 0

1回答

使用newspaper3k从新闻源获取更多文章URL？

python、python-newspaper、newspaper3k

当我这样做的时候paper = newspaper.build('http://cnn.com', memoize_articles=False)我看到报纸上发现了902篇来自的文章，考虑到他们每天都会发表很多文章，而且已经在网上发表了很多年了，这对我来说似乎并不算什么。这些真的是上所有的文章吗？如果没有，有没有办法让我也能找到其他文章的网址？

浏览 4提问于2020-09-28得票数 0

1回答

Python的报纸包返回哪些文章？

python、python-3.x、python-newspaper

我的基本问题是，Python中的报纸包如何确定它返回的urls/文章？有人会认为它只是返回你提供的url上包含的所有文章链接，但它似乎不是这样工作的。它只是从主页获取所有的文章吗？下面是我用来测试的一个例子(我使用的是python版本3.6.2)：url = "http://www.c

浏览 13提问于2018-02-11得票数 1

1回答

Facebook分享上的Friendly URl

facebook、web-applications、web、facebook-sharer

当用户在Facebook上进行分享时，它就会在他/她的墙上共享URL。但我想添加一些描述，就像所有的新闻报纸做it.CNN和NYTimes一样。当用户分享一些东西时，URL会挂在墙上，但会有文章的标题或更大字体的东西，能够吸引人们的注意。我该怎么做呢？

浏览 0提问于2012-07-03得票数 0

回答已采纳

1回答

从新闻网站上抓取新闻标题

python、web-scraping、beautifulsoup、newspaper3k

我一直在努力从新闻网站上抓取新闻标题。为此，我遇到了两个python库，即“报纸”和“beautifulsoup4”。使用美丽的汤库，我已经能够从一个特定的新闻网站获得所有的链接，导致新闻文章。从下面的代码中，我能够从一个链接中提取新闻文章的标题。-16-for-classes-9-12-news-agency-pti-2324199"article.download() arti

浏览 4提问于2020-11-20得票数 1

回答已采纳

1回答

Python 3:如何获取包含特定关键字的新闻文章

python、python-3.x、search-engine、textblob、python-newspaper

我正在尝试写一个小的web应用程序，它返回涉及关键字的新闻文章的情绪。有没有办法获取包含特定关键字的报纸文章列表？此外，报纸是否有可能遍历页面？q=' #Currently

浏览 1提问于2016-05-22得票数 3

1回答

在单个应用程序中集成新闻更新

java、android

我想创建一个应用程序，将所有的新闻更新集成在一个地方最好的例子: NewsHunt 如何与不同的新闻源进行通信？是否有任何API或网络服务可用于从不同的报纸获取所有最新的新闻更新。

浏览 0提问于2013-10-16得票数 0

1回答

为什么我的Newspaper3k代码不能使用“新闻周刊”？

python-newspaper

我的工作是木星笔记本和报纸有一个问题，无法从新闻周刊的任何东西。我可以让它在Goose上运行，但我想要一个后备，以防Goose失败。url = 'https://www.newsweek.com/mike-huckabee-blasts-cnns-axelrod- calling-daughter-trump-press-secretary-sar

浏览 0提问于2019-06-15得票数 1

回答已采纳

1回答

Google Feed API：“不支持提要URL中指定的端口。”

ajax、atom-feed、google-feed-api

我收到错误消息“提要URL中指定的端口不受支持”。有什么想法或建议吗？

浏览 2提问于2012-05-09得票数 0

1回答

带有网络存档的Python报纸(回程机)

python、python-3.x、archive、python-newspaper、newspaper3k

我正在尝试将Python 与来自的档案一起使用，后者存储已存档的网站的旧版本。从理论上讲，可以从这些档案中查询和下载旧新闻文章。url = 'http://web.archive.org/web/20161201123529/http://www.cnbc.com/' paper = newspaper.build(url, memo

浏览 2提问于2017-01-16得票数 4

回答已采纳

2回答

如何使用报纸库只解析特定类别的网站？

python、python-3.x、parsing、web-scraping、python-newspaper

我使用Python3和newspaper库。据说这个库可以创建一个Source对象，它是新闻网站的抽象。但是如果我只需要某个类别的抽象呢？例如，当我使用时，我希望获得'technology'类别的所有文章。取而代之的是，我从'politics'获取文章。我认为在创建Source对象时，报纸只使用域名，在我的例子中是www.kyivpost.com)。

浏览 3提问于2016-07-06得票数 8

2回答

Feedparser -从Google Reader检索旧消息

python、rss、google-reader、feedparser

我正在使用python中的feed past库从本地报纸中检索新闻(我的目的是在这个语料库上进行自然语言处理)，并且希望能够从RSS提要中检索许多过去的条目。= feedparser.parse(url) title = post.title我打算只从rss feed获得新闻条目的链接，并使用BeautifulSoup

浏览 1提问于2009-11-05得票数 6

回答已采纳

1回答

我有一个python程序，它可以下载文章文本，然后将其转换为txt文件。程序当前在程序所在的目录中显示txt文件。我想把这个文本放在特定于他们的新闻来源的文件夹中。我是否可以将数据保存在python程序本身的文件夹中，并在新闻源文件更改时更改目录？或者我应该创建一个shell脚本，在它需要放在的文件夹中运行python程序？下面是Python程序的代码：from goose import Gooseimport cod

浏览 1提问于2015-05-08得票数 0

回答已采纳

2回答

如何使用Jsoup从html文件中获取特定数据？

java、html、web-crawler、html-parsing、jsoup

我有一个本地语言新闻报纸的html文件，我想收集所有在新闻报纸上只有本地语言的单词。我在html文件中观察到，本地语言中的所有单词都在类字段内容的div元素下，所以我选择了它的元素来获取数据，但是div元素也包含类似于本地语言单词存在的元素。<div class = "field-content"></div> 因此，如何从html文件中只获取本地语言的单词。

浏览 3提问于2016-03-15得票数 0

回答已采纳

3回答

Python正则表达式:检测包含特定单词的模式？

python、regex

句子："[cnn news, Chris] Stackoverflow is awesome"。我的表情怎么了？

浏览 0提问于2018-05-25得票数 0

1回答

Facebook Graph API点赞数错误

facebook-graph-api、facebook-like

在图形api中有几种方法可以获取页面点赞数，最简单的方法就是通过这个url获取JSON响应，例如：但是，该方法返回错误的点赞数量： "id": "http://cnn.com/", "comment

浏览 0提问于2012-12-14得票数 1

1回答

C#从HTML文档中提取内容

c#、html、windows-phone-7

示例：我的想法是只从网页中获取纯文本，例如，如果url是一篇报纸文章，我如何才能只获取新闻文本，如图所示。

浏览 3提问于2012-06-24得票数 4

回答已采纳

1回答

使用BeautifulSoup获取搜索结果编号

python、html、web、beautifulsoup、web-crawler

我试图在Python中使用BeautifulSoup来获取CNN中搜索结果的总数。toronto</strong> 如截图1所示：我写的代码是： html_

浏览 1提问于2020-03-21得票数 0

回答已采纳

点击加载更多