如何使用Python抓取RottenTomatoes观众评论？

使用Python抓取RottenTomatoes观众评论可以通过以下步骤实现：

导入所需的库：使用Python的requests库发送HTTP请求，使用BeautifulSoup库解析HTML页面。

import requests
from bs4 import BeautifulSoup

发送HTTP请求获取页面内容：使用requests库发送GET请求，获取RottenTomatoes电影页面的HTML内容。

url = "https://www.rottentomatoes.com/m/movie_name/reviews?type=user"
response = requests.get(url)
html_content = response.text

请注意，将"movie_name"替换为实际电影的名称。

解析HTML内容：使用BeautifulSoup库解析HTML内容，提取观众评论。

soup = BeautifulSoup(html_content, "html.parser")
reviews = soup.find_all("div", class_="user_review")
for review in reviews:
    comment = review.find("div", class_="user_review--base")
    print(comment.text)

这将打印出每个观众评论的文本内容。

分页抓取：如果需要抓取多页观众评论，可以通过修改URL中的页码来实现。

for page in range(1, num_pages + 1):
    url = f"https://www.rottentomatoes.com/m/movie_name/reviews?page={page}&type=user"
    response = requests.get(url)
    html_content = response.text
    soup = BeautifulSoup(html_content, "html.parser")
    reviews = soup.find_all("div", class_="user_review")
    for review in reviews:
        comment = review.find("div", class_="user_review--base")
        print(comment.text)

请注意，将"movie_name"替换为实际电影的名称，并将"num_pages"替换为要抓取的页数。

这是使用Python抓取RottenTomatoes观众评论的基本步骤。根据实际需求，你可以进一步处理评论数据，例如保存到文件、进行情感分析等。

如何使用Python抓取RottenTomatoes观众评论？

、、、

我正在创建一个蜘蛛，使用scrapy从rottentomatoes.com中抓取细节。q=inception使用了rottentomatoes来获取搜索结果和URL。通过scrapy的URL，我能够提取tomatometer分数，观众分数，导演，演员等。但是，我也想提取所有观众的评论。问题是，观众评论页面(https://www.rottentomatoes.com/m

浏览 36提问于2020-06-15得票数 1

1回答

使用剪贴画的WebScraping用户评论不转到“下一页”

、、、

我找到了这部电影“烂番茄”的第一页“所有观众”的评论：https://www.rottentomatoes.com/m/ghostbusters/reviews?type=user。我现在的问题是，与“所有评论家”的评论加载更多的评论不同，在“所有观众”中，你点击“下一步”，而不是点击“下一页”，这会添加到URL page=2中。现在我不能这样做了，我需要弄清楚如何点击“下一步”并获得新的链接。我想知

浏览 17提问于2021-02-03得票数 0

1回答

如何从烂番茄中抓取超过一页的评论家评论？

、、

我一直在使用这个抓取器来抓取这个网址：https://www.rottentomatoes.com/m/avengers_endgame/reviews的评论家评论，但是，我一直在为如何浏览额外的页面而苦苦挣扎，因为它目前抓取了第一个页面的评论家评论。from selenium import webdriverdriver =

浏览 24提问于2020-10-05得票数 1

回答已采纳

1回答

RottenTomatoes电影按观众排列

RottenTomatoes有一个顶级电影页面。然而，排名是基于“断层计”的分数。相反，我想按“观众”评分列出最佳影片的名单。(每部电影都有验光仪和观众评分。)我怎样才能在RottenTomatoes上按观众评分对电影排名呢？

浏览 0提问于2013-06-04得票数 5

回答已采纳

1回答

BeautifulSoup web抓取多个页面URL不变

、、、、

当使用漂亮的汤来进行网络刮擦评论时，当涉及到“所有观众”的评论时，我有一个问题。更改审阅列表页时，URL不会更新。下面是一个示例：https://www.rottentomatoes.com/m/midsommar/reviews?type=user 单击下一步时，不会更改URL。下面是RequestURL如何在页面之间更改。 Request URL page 1->2 Request URL page 2->3 我怎样才能让

浏览 21提问于2019-09-20得票数 1

回答已采纳

1回答

在谷歌表格中用ImportXML刮烂番茄的分数

、

每年，我和我的朋友们都会做一个游泳池，在那里我们会猜测夏季上映的随机组合的电影的腐烂番茄评论百分比。我们有一个电子表格，可以跟踪每个人的猜测，并动态计算分数。电子表格抓取腐烂西红柿的百分比。由于去年我们没有播放COVID，但我正在为今年夏天的电影更新电子表格，我在抓取数据时遇到了问题。我在本例中使用的电影的URL：https://www.rottentomatoes.com/m/wrath_of_man 以下是我在2019年使用的ImportXML

浏览 8提问于2021-05-06得票数 2

1回答

很难让BeautifulSoup返回电影标题& h3类在href中的分数

、、、

这就是我的Python脚本..。import requests url = "https://www.rottentomatoes.com/browse/dvd-top-rentals

浏览 4提问于2017-01-24得票数 1

回答已采纳

1回答

HTML子页面更改而不更改url

、、、

我试图用python抓取这个产品的评论，但我注意到我改变了评论页面的页面，网址根本没有改变，所以我不知道如何在我的程序中切换评论页面，我试图抓取的网址是：

浏览 13提问于2021-05-23得票数 0

1回答

从R中的多个页面中抓取评论

、、

我正努力在一个网页上完成抓取工作。我的任务是从网站上收集评论，并对其进行情感分析。但是我只在第一页就完成了抓取，我怎么才能把同一部电影的所有评论都刮到多个页面上。这是我的密码： html_elements(xpath = "//di

浏览 5提问于2022-05-29得票数 0

回答已采纳

0回答

与视频直播同步文字聊天

、、、、

我有一个使用wowza的直播流服务。我想在里面添加文字聊天，这样观众就可以评论他们看了什么！问题是，如果我使用套接字发送评论，它将不会与正确的视频帧同步。我需要帮助来匹配视频和评论的时间在一个正确的时间。因此，当观众回放视频点播时，他们也可以在正确的时间看到评论。我找到了一些像ntp这样的解决方案，潜望镜使用。但我不知道该如何使用它。

浏览 9提问于2017-06-19得票数 0

2回答

我如何在网页上刮动这个动态页面？

、、

我试图在网上刮烂番茄的电影评论。下面的就是一个例子。我是一个网络刮刮和硒的初学者。browser = webdriver.Chrome(executable_path="/Users/me/Downloads/chromedriver") url = "https:/&#x

浏览 2提问于2019-06-14得票数 1

回答已采纳

2回答

在烂番茄上找不到HTML元素

、、

我想找到一部电影，并在烂番茄上获得它的评级，但我卡住了，因为我不知道如何在搜索结果部分点击它。我几乎尝试了所有的XPATH或类名，但每次都收到错误消息，指出它找不到元素。我使用的是Python Selenium。)) return element print("Can not locate this element") element

浏览 11提问于2020-12-25得票数 1

回答已采纳

1回答

刮擦时出错：“预期值:第1列(char 0)”

、、、

我正在使用以下代码从烂番茄网站上抓取评论：import reimport pandas as pd r = requests.get(f&quo

浏览 5提问于2021-07-16得票数 1

回答已采纳

1回答

如何使用Python抓取多个评论页面？

、、

我想得到几个使用Python的评论页面。这是我的网络爬虫代码。client.get(jre)print(html) 这段代码只获取page=1，但我想获取page=1、page=2、page3……使用格式化方法

浏览 11提问于2020-01-25得票数 2

1回答

如何在没有api的情况下获取json数据

、、

基本上，我想让流媒体出现在我的网站的"Live Now“部分，如果他们的观众计数是1或更多，但我不知道如何获得观众计数。我知道如果我使用python，我可以使用像Selenium这样的东西，并且可以在我的pc上运行它，但我需要网站知道它。我试过抓取页面，但我不认为你能抓取动态内容。当我尝试使用SimpleHTMLDom时，它只返回静态元素。 <?> 我根本不知道如何进行调用/请求来获取

浏览 62提问于2019-06-07得票数 0

2回答

不能使用美汤和硒遍历元素来刮烂西红柿评级数据

、、、、

我试图找到包含评级数据的元素，但我不知道如何遍历它(下面的图像链接)。评论家评分和观众评分的span元素都在同一个类中(mop-等级-包装__百分比)。webdriver.Chrome("/Users/*/Downloads/chromedriver") audience_rating=[] driver.get("https://www.rottentomatoes.com

浏览 0提问于2020-09-12得票数 0

2回答