python爬行以提取评论计数_Python Crawl --使用BeautifulSoup进行Amazom评论爬行_Python -爬行目录，从ZIPs中提取CSV文件，并组合多个CSV - 腾讯云开发者社区

python、web-crawler

我试着用python让评论成为爬虫。in bsObj.findAll(attrs={'class': 'product-reviews-count'}) 但是我不能得到标签enter image description here之间的评论计数实际上，由于我不是开发人员，这将是一个棘手的问题如果你需要更多的信息来解决这个问题，请发表评论。

浏览 10提问于2020-07-19得票数 0

回答已采纳

2回答

从TripAdvisor抓取数据的任何建议

nlp、web-crawler、corpus

我们目前正在研究一个NLP项目，需要一个从tripadvisor.com中提取的语料库。我们期望输出为两种类型:注释和该评论的评级。我的问题是：该语料库将用于大学研究的情感分析，我们需要尽

浏览 6提问于2013-01-16得票数 3

1回答

使用Selenium Webdriver (Python)从网站提取图像

python、selenium

我需要爬行几千个子网站，并提取信息。如何提取这些图像以进一步处理它们？我在Python上使用Selenium Webdriver。

浏览 1提问于2013-09-02得票数 2

1回答

谷歌没有列出我的网站

google、google-search-console、google-search

我有一个网站，这是超过2个月的历史，它没有显示，当你直接键入网址到谷歌。以下是站点的链接: www.icarda.org 然而，该网站是在必应和雅虎上市，没有任何问题。请帮我解决这个问题。

浏览 0提问于2012-12-09得票数 0

2回答

如何在使用response.css提取时删除/n和逗号

python、css、web-scraping

我正在尝试爬行亚马逊，以获得产品名称，价格和节省信息。我正在使用response.css提取保存信息，如下所示savingsinfo = amzscrape.css(".a-color-secondary .a-row ,

浏览 11提问于2019-10-30得票数 1

1回答

获取没有href属性的链接: Selenium-Python

python、selenium、web-crawler

我目前正试图通过一个指定的爬行深度的整个网站使用selenium-python爬行。我从开始，并考虑通过爬行来继续前进，同时开发代码。它的工作方式是:如果页面是“www.google.com”，并且其中有15个链接，那么一旦获取所有链接，就会将其存储在字典中，其中以“www.google.com”作为键，并以15个链接的列表作为值。然后，从相应的字典中提取这15个链接中的每一个，然后以递归方式继续爬行。这方面的问题是，它在页面上找到的每个链接的

浏览 2提问于2017-09-28得票数 0

1回答

EmberJS中的自动计算组件

ember.js、ember-data

我试图在Ember中创建一个组件，显示一个帖子有多少评论。我从API中提取评论。现在的问题是，如果有新的注释，它不会重新查询API。是否有办法让Ember组件每15秒自动检查一次以更新计数？

浏览 3提问于2016-10-03得票数 0

回答已采纳

1回答

Yammer REST消息注释和消息历史记录

yammer

我的目标是收集每个非私密信息的赞数，并在一个Yammer实例中(跨越所有网络)进行评论。目前，我可以使用数据导出API为Yammer实例提取所有消息，但不幸的是，它不包含消息的类似计数。我还可以通过REST成功地在消息中页面，但是，提取消息的唯一选项似乎只有没有注释的原始消息，或者原始消息，以及每条消息上的前两个注释。因此，我的问题如下：是否有一种

浏览 4提问于2014-07-28得票数 1

回答已采纳

1回答

如何组合WebDriver find_elements_by*调用，同时跟踪结果的顺序？

python、python-2.7、selenium、selenium-webdriver、webdriver

在一个典型的谷歌本地搜索结果页面上，比如，它有20个搜索结果：评论或者以“无评论”的形式出现，可以使用以下方法提取：或者：driver.find_elements_by_css_selector("div:nth-child(1) > div:nth-child:nth-child(1) > div:nth

浏览 0提问于2015-10-22得票数 1

回答已采纳

1回答

浏览零售商网站上的每一件商品

python、web-scraping、beautifulsoup、web-crawler、python-requests

给定一个产品页面，我们知道如何提取所需的信息，并且给定一个类别，我们可以提取每个产品。然而，我们不知道如何在每个产品类别中爬行。params=params).json()print j 正如您在评论中所看到的I和j只是产品和页面计数器。关于如何修改/添加此代码以获取每个产品类别，有什么建议吗？

浏览 0提问于2016-11-04得票数 1

1回答

如何从多个网页中提取内容？

python、web-scraping

我想从各种评论网站中提取某些内容(评论信息)。from webscraping import download, xpath# download and cache我想扩

浏览 0提问于2017-04-25得票数 2

2回答

每日交易聚合器如何从不同的交易网站获取数据？

javascript、python、screen-scraping、web-scraping

我想知道每日交易聚合器如何从不同的交易网站上删除数据？我已经看到许多交易网站不提供API和RSS订阅，但仍然这个聚合器从他们中剔除数据。以下是我所指的一些网站

浏览 1提问于2011-08-05得票数 1

回答已采纳

2回答

解析和拆分多个HTML页面没有线索

python、regex、html-parsing、data-mining

关键词都是这样的必须对爬行的HTML内容进行分类，并将映射到相关关键字。还需要将内容和它的标题从页面中拆分以进行比较你能建议一下怎么做吗？哪一种比较适合选择？这个想法必须如何组织起来？

浏览 4提问于2012-01-11得票数 0

3回答

检索特定产品的Amazon评论

python、amazon-web-services、web-scraping、amazon-product-api

我目前正在做一个研究项目，该项目需要分析特定产品的评论，并对该产品有一个整体的了解。有没有什么方法/地方可以检索用户对给定产品的评论？

浏览 19提问于2017-01-29得票数 1

回答已采纳

2回答

爬虫会在这个服务器配置上工作吗？

php、mysql、database、hosting、web-crawler

我所要做的就是爬行大约一百万页，并将它们存储在数据库中。(是的，它将不时更新，但任何特定时间的条目将仅为100万)，仅仅是为了了解这些东西是如何工作的。想知道这一设计是否可行，在以下环境。我的问题是：是否能够支持这个大型数据库(100万行)，并能够在需要时以批处理模式运行查询。欢迎任何建议。任何其他主机选择也将受到赞赏。

浏览 4提问于2011-04-13得票数 0

1回答

检测线程树何时完成

multithreading、tree、continuations

它所做的就是接受一个URL，下载HTML并提取剩余的URL。然后，它对每个新URL重复该过程。我还确保不会访问同一个URL两次，并限制并发下载的数量。

浏览 0提问于2012-05-24得票数 1

回答已采纳

3回答

如何在登录后爬行/索引页？

indexing、authentication、web-crawler

是否有可能(有任何工具)抓取登录后的页面(不是内容，只是url)？我们期待创建一个新的网站，并需要索引每一页的旧网站，以便捕获所有的内容，内容类型，映射所有的网址到新的网站，等等。我有一个登录，我不想把这个添加到谷歌或任何东西。

浏览 4提问于2015-04-01得票数 1

回答已采纳

1回答

如何获得Python Scrapy Crawler的详细信息？

php、python、scrapy

我正在使用Python工具从网站中提取数据。我正在使用proc_open()从我的php代码中触发Scrapy。现在我需要维护仪表盘之类的东西。爬行器状态(活动或停止)。同时运行的爬行者列表。

浏览 1提问于2013-10-08得票数 3

回答已采纳

1回答

HOw渴望seo更改采用effect?>

seo、updates

我有一个网站，我提交给谷歌，做了一些网站管理员工具的东西(网站地图，首选领域等)，并建立了大约一周前的分析。我应该重新提交到谷歌网站，这将需要多长时间，我将看到任何结果，我的实验！

浏览 1提问于2014-03-25得票数 0

回答已采纳

1回答

Google结构化数据项计数不会随着新页面的索引而增加

google-search-console、structured-data

几个月前，我在一个我管理的网站上添加了结构化数据，尽管它正在以每天大约25项的速度进行索引，但项目计数似乎并没有增长。根据图表，它是相对平缓的，有些日子实际上是减少了。没有报告的错误，我可以看到。按照目前的索引率，项目计数到现在应该至少增加到2000+ (我的站点地图中有超过10万页)，但是由于除了屏幕截图中的图表之外，似乎没有其他历史数据，所以我很难理解哪些项目出现了下降以及原因。📷 澄清一下，这不是关于爬行率的问题。爬行率很好，我每天都能看到新的页面被添加到索引中。问题是为什么图表中的项目计数

浏览 0提问于2017-01-02得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云