如何使用Python抓取多个评论页面？

使用Python抓取多个评论页面可以通过以下步骤实现：

导入所需的库：首先，需要导入Python的requests库和BeautifulSoup库。Requests库用于发送HTTP请求，BeautifulSoup库用于解析HTML页面。
发送HTTP请求：使用requests库发送HTTP GET请求，获取评论页面的HTML内容。可以使用requests.get()方法，并传入评论页面的URL作为参数。
解析HTML内容：使用BeautifulSoup库解析HTML内容，提取所需的评论数据。可以使用BeautifulSoup()方法，并传入HTML内容和解析器类型（如"html.parser"）作为参数。
定位评论数据：通过分析评论页面的HTML结构，使用BeautifulSoup库提供的方法（如find_all()、select()）定位评论数据所在的HTML元素。
提取评论数据：根据定位到的HTML元素，使用BeautifulSoup库提供的方法（如get_text()、get()）提取评论数据。
处理多个评论页面：如果需要抓取多个评论页面，可以使用循环结构（如for循环）遍历评论页面的URL列表，依次抓取每个页面的评论数据。

以下是一个示例代码，演示如何使用Python抓取多个评论页面：

import requests
from bs4 import BeautifulSoup

# 定义评论页面的URL列表
comment_urls = [
    'https://example.com/comments/page1',
    'https://example.com/comments/page2',
    'https://example.com/comments/page3'
]

# 遍历评论页面的URL列表
for url in comment_urls:
    # 发送HTTP GET请求，获取评论页面的HTML内容
    response = requests.get(url)
    html_content = response.text
    
    # 解析HTML内容，提取评论数据
    soup = BeautifulSoup(html_content, 'html.parser')
    comments = soup.find_all('div', class_='comment')
    
    # 提取评论数据
    for comment in comments:
        # 处理评论数据，如提取评论内容、作者、时间等
        comment_text = comment.get_text()
        author = comment.find('span', class_='author').get_text()
        timestamp = comment.find('span', class_='timestamp').get_text()
        
        # 打印评论数据
        print('评论内容：', comment_text)
        print('作者：', author)
        print('时间：', timestamp)
        print('---')

请注意，以上示例代码仅为演示抓取多个评论页面的基本思路，实际应用中可能需要根据具体的评论页面结构进行适当的调整和优化。另外，根据具体需求，可能还需要处理分页、登录验证、反爬虫机制等问题。

页面内容是否对你有帮助？

有帮助

没帮助

如何使用Python抓取多个评论页面？

python、python-requests、web-crawler

我想得到几个使用Python的评论页面。这是我的网络爬虫代码。client.get(jre)print(html) 这段代码只获取page=1，但我想获取page=1、page=2、page3……使用格式化方法

浏览 11提问于2020-01-25得票数 2

1回答

使用Python抓取Javascript加载的页面

python、web-scraping

我正在尝试使用Python从英国广播公司的一篇文章中抓取评论：然而，我想要抓取多个页面，但当我尝试更改第一页中的“page=x”时，它只会将我带到第一页。我考虑过使用Selenium/Dryscape，但我不确定如何才能到达每个页面来运行它们。

浏览 1提问于2016-11-25得票数 1

1回答

HTML子页面更改而不更改url

python、html、web-scraping、web-crawler

我试图用python抓取这个产品的评论，但我注意到我改变了评论页面的页面，网址根本没有改变，所以我不知道如何在我的程序中切换评论页面，我试图抓取的网址是：

浏览 13提问于2021-05-23得票数 0

1回答

r.html.find仅获取1个项目，而不是全部

web-scraping、python-requests-html

我有一个脚本，抓取项目的类别与请求的html。reviewtext = r.html.find( 'strong.reviews__item-title', first=True).text 然而，虽然抓取的类被分类为页面上的多个元素(评论)，但只有一个项目(第一个评论)被抓取。我如何正确地实现for循环或类似的东西，这样我的程序才能抓取前3个或一定数量的产品评论，而不仅仅

浏览 41提问于2021-10-12得票数 -1

1回答

触发AJAX时获取JSON文件

ajax、json、web-crawler

我正在编写一个爬虫从一个使用AJAX的网站获取内容。在页面底部有一个“显示更多”按钮，我最初的方法是使用Selenium.PhantomJS来伪装成一个web浏览器，但它在一些网站上可以工作，有些不能。顺便说一下，我使用的是Python。

浏览 0提问于2014-07-23得票数 0

1回答

使用python从产品页面中抓取评论

python、web-scraping、product、review

‘我正在写这段代码，但它只给了我4篇评论，我想要所有产品的评论，请帮助我完成我的代码。’

浏览 5提问于2022-06-29得票数 0

回答已采纳

1回答

使用curl抓取大页面

php、curl、screen-scraping

我正在尝试从一个流行的新闻网站上收集评论，以便使用curl进行学术研究。对于评论少于300条的文章，它可以很好地工作，但在此之后，它就会陷入困境。$html = curl_exec($handle);echo $html; //just to see what's been scraped但是这个只返回了36条评论，尽管总共有700+：为什么它在拥有大量评论的文章中苦苦挣扎？

浏览 2提问于2012-08-23得票数 0

2回答

用JQuery还是Python抓取？

jquery、python、screen-scraping

因此，假设我在一个网站上抓取多个页面(比方说1000)。我想知道哪种语言最适合用来抓取这些页面- javascript还是python。此外，我听说过javascript抓取器更快(由于多个get请求)，但我不确定如何实现这一点-有人能告诉我吗？谢谢!

浏览 1提问于2012-03-04得票数 0

回答已采纳

1回答

使用R在多个页面上进行Web抓取

r、web-scraping

我正在尝试使用R中的以下url来抓取产品的评论。当我运行下面的代码时，我能够获得单个评论被抓取。html_node(".content-item-text") %>% html_text()但是，当我使用下面的代码抓取多个页面上的多个注释时

浏览 10提问于2017-06-27得票数 0

2回答

如何抓取Google Play Store上应用程序的所有评论？

android、google-play、web-crawler

当我在Google Play Store上抓取一个应用程序页面时，我只能抓取应用程序评论的前几个页面。我如何抓取其他评论？

浏览 6提问于2015-01-09得票数 4

回答已采纳

1回答

从多个页面中抓取表格

python、beautifulsoup

我想从网站上抓取数据。这个表扩展到多个页面上，但是url没有像page=3这样的东西，所以我不能遍历各个页面来获取数据。有没有其他方法可以像这样抓取数据，而不会在不同的页面上循环？如何从python访问不同的页面来抓取数据？

浏览 19提问于2018-03-04得票数 0

1回答

如何从多个网页中提取内容？

python、web-scraping

我想从各种评论网站中提取某些内容(评论信息)。from webscraping import download, xpath# download and cache我想扩

浏览 0提问于2017-04-25得票数 2

2回答

使用python抓取多个页面

python、pandas

我在抓取时遇到问题 url从1开始增加30。它包含许多页面，其中列出了肯尼亚的中学列表。每一页都有30所学校的列表。我想用下面的代码抓取所有的数据，但它只给出了一个页面的内容，这是30所学校。我已经对url进行了字符串格式化，但仍返回一个页面的数据。

浏览 0提问于2018-06-23得票数 0

2回答

使用python抓取多个页面

python、web-scraping、beautifulsoup

我正试着用漂亮的汤拼凑出一个多页面的网站。代码部分工作。它只返回最后一页，而不是所有页。我如何解决这个问题？

浏览 3提问于2018-09-03得票数 0

回答已采纳

1回答

如何抓取多个页面和每个页面的不同项目？

python、beautifulsoup

我是python的初学者，只有几个星期在尝试做我的网络抓取。我需要在tripadvisor上抓取一家餐厅的多个页面，在windows32上使用漂亮的汤。在每个页面中，我需要记录餐厅名称、社会等级和菜肴/菜肴、客户名称、日期评论、滴滴评论和评论。我在python控制台中尝试了以下代码：from bs4 i

浏览 0提问于2019-08-15得票数 0

1回答

从R中的多个页面中抓取评论

r、web-scraping、rvest

我正努力在一个网页上完成抓取工作。我的任务是从网站上收集评论，并对其进行情感分析。但是我只在第一页就完成了抓取，我怎么才能把同一部电影的所有评论都刮到多个页面上。/reviews") %>% html_text2() 这只会让我从第一页得到评论，但我需要所有<

浏览 5提问于2022-05-29得票数 0

回答已采纳

1回答

无法使用python、selenium和美汤抓取评论页面

python、selenium、web-scraping、beautifulsoup

我在试着抓取一个Flipkart评论页面 https://www.flipkart.com/reviews/b9ec5c5c-3814-40ef-8f73-84f253ee09ce 我用的是蟒蛇，美丽的汤和硒无论我添加了多长时间的延迟，实际的评论都没有加载到页面中，下面是一段时间后加载的评论片段。 ? 任何提示和建议都会很有帮助。

浏览 7提问于2021-01-22得票数 1

回答已采纳

2回答