使用R的rvest包和RSelenium进行网页抓取

文章/答案/技术大牛

发布

2回答

、、、

我通常可以在rvest中使用read_html命令来抓取超文本标记语言的表格，但是对于一个特定的网站，我却遇到了一些麻烦。任何帮助都将不胜感激。下面是我的工作流程：library(rvest)url2 <- "http://priceonomics.com我想刮掉那个网站上的第二张桌子。我还尝试了以下几种方

浏览 1提问于2016-08-09得票数 3

回答已采纳

1回答

用httr修改html/javascript代码

、、

我正试着制作一个脚本来检查是否有人去过这所学校，使用他们的。(你可以用弗朗索瓦奥朗德(现任法国总统)这个名字来观察它的表现)<div class="annuaireRecherche-v2然后，我将不得不以某种方式“单击”右边的afficher les résultats (翻译：show results)。ui-button-icon-primary ui

浏览 4提问于2016-05-01得票数 1

回答已采纳

1回答

查找带有最后页号的html节点

、、、

我正在学习网络抓取，并为自己创建了一个小小的练习来刮除菜谱网站的所有标题：。(我受到这篇文章的启发：)。libr

浏览 2提问于2020-05-29得票数 2

回答已采纳

1回答

rvest::html_text和RSelenium::getPageSource之间有什么区别？

、、、、

我正在抓取许多网页，在那里我注意到rvest (read_html，然后是html_text)提供的不同结果，以及RSelenium (getPageSource())提供的结果。更具体地说，当涉及下拉菜单时，使用html_text只给出选项的名称，而使用RSelenium时，您可以获得一旦选择一个页面的网址。我在这里的问题是：(1)为什么有差别，区别的本质是什么？(2)是否有一种方法可以获得与<

浏览 1提问于2019-08-06得票数 3

回答已采纳

1回答

在R中抓取Javascript生成的内容

、、

我发现，通过获取生成网页的html代码，可以轻松地使用rvest包实现R中的web抓取任务。然而，当网站使用Javascript显示相关数据时，这种“通常”的方法(我可以这样称呼它)似乎遗漏了一些功能。作为一个工作的例子，我想从网站上抓取新闻标题。通常方法的两个主要障碍是底部的“load more”按钮和使用x

浏览 3提问于2016-01-05得票数 0

1回答

调用clickElement()函数时出现RSelenium未知错误

、、

我想使用R包'Rvest‘抓取holidayiq.com酒店评论数据，例如。'RSelenium‘用于单击"Next >“链接，以访问更多页面。每当我使用代码nxtButton = mybrowser$findElement(using = 'css selector', "#next") nxtButton$clickElement()访问下一个页面时提前感谢您的帮助。

浏览 1提问于2016-03-02得票数 0

1回答

R中的网络抓取不显示节点

、、、

我正在尝试使用rvest从这个website获取所有商品和价格的列表。这是一个相当简单的任务，但我总是得到一个空列表。到目前为止，我已经使用了下面的代码，但没有效果。

浏览 7提问于2020-12-02得票数 0

1回答

R数据抓取返回空表

、、

新编程和试图从下面的网站报废数据。当我运行下面的代码时，它返回一个空的数据集或表。任何帮助或替代将是非常感谢的。tab <- url %>% read_html %>% html_text() 尝试使用xpath和相同的结果，html_table()而不是文本返回一个错误，不适用于应用于类"xml_missing“对象

浏览 0提问于2018-09-09得票数 1

1回答

抓取R中的iframe数据

、、、、

我正在尝试使用r抓取网页，但问题是抓取的html只包含iframe标签链接()。有没有办法使用任何包从r中的iframe标签获取数据(最好是revst或RSelenium？我要抓取上述链接(id=pagebody)中的所有(150)个渠道合作伙伴名称谢谢

浏览 0提问于2016-06-28得票数 0

1回答

如何访问使用RSelenium与rvest刮过的页面？

、、、、

我正在尝试刮一个使用angular.js的网页。我的理解是，R中唯一的选项是首先使用RSelenium加载页面，然后解析内容。但是，我发现rvest比RSelenium更直观地解析内容，因此我希望尽可能少地使用RSelenium，然后尽快切换到rvest。到目前为止，我已经意识到，我可能至少需要使用RSelenium来使

浏览 2提问于2017-09-03得票数 0

回答已采纳

1回答

R/ Rvest* / RSelenium:从JS站点刮取数据*

、、、、

我是新的与R和Rvest的网络刮刮主题。使用rvest，您可以刮静态HTML，但是我发现，从基于JS的重站点中抓取数据是非常困难的。我找到了一些文章或博客文章，但它们似乎像一样被贬低了。在我的例子中，我想从体育博彩网站中获得赔率，但在我看来，由于JS，这在我看来是不可能的。2018年有一篇关于从PaddyPower()获取赔率的文章，但这也过时了，因为Phant

浏览 2提问于2020-09-13得票数 1

回答已采纳

1回答

如何使用R从启用了javascript的网页中提取链接

、、、、

我正在尝试提取网页上的所有链接："“url_page<-"https://coronavirus.data.gov.uk/archive/"all_links<-html_attr(html_nodes(webpage, "a"), "href")

浏览 1提问于2020-05-31得票数 0

2回答

使用rvest和R进行网页抓取

、、、、

我想网络刮这个网站的https://www.askramar.com/Ponuda。首先，我应该抓取所有指向每个汽车页面的链接。在html结构中，扩展链接如下所示： ? 我尝试了下面的代码，但在R中得到了一个空对象： url <- "https://www.askramar.com/Ponuda" links[contains(concat(" ", @cl

浏览 13提问于2019-12-30得票数 1

回答已采纳

1回答

如何使用xpath检查对象在网页中是否可见？

、、、、

我正在使用R中的RSelenium包进行网络抓取。有时在加载网页之后，需要检查一个对象在网页中是否可见。例如：RSelenium::startServer()remDr <-，我应该使用什么功能“存在”？我还找到了用于使用

浏览 2提问于2015-12-07得票数 8

回答已采纳

1回答

在R中用rvest软件包刮取soundcloud.com

、、

我正在尝试刮这个，以获得加拿大前50名soundcloud艺术家的名字。library(rvest)library(reshape2) artist_name <- soundclo

浏览 6提问于2020-12-10得票数 0

回答已采纳

1回答

当试图收集产品价格信息时，rvest* web scraping返回一个空的数据帧。*

、、、、

我正在尝试使用'rvest‘从：中提取产品价格。我使用以下代码：library(tidyverse) url <- "https://www.lowes.com/pl/Lawn-garden-hand-tools-Outdoor-tools-equipment-Outdoorsclass, 'h5 js-price v-spacing-mini art-pl-price')]") %>%

浏览 7提问于2020-06-18得票数 2

回答已采纳

1回答

从网页中获取内部信息的r中使用的web抓取

我在将rvest/XML包加载到R时遇到了困难，并且无法处理代码。forbs <- readHTMLTable("https://www.forbes.com/powerful-brands/list/")View(fo

浏览 2提问于2019-04-05得票数 1

1回答

从404错误抓取URL中的数据-抓取

、、

我试图从一个网页上抓取数据，但我得到了一个404错误的网址如下。但是，我需要从浏览器中获取404链接中的数据。示例如下：library(rvest) 

浏览 3提问于2018-05-28得票数 0

2回答

用于文本提取的rvest与RSelenium结果

、、

到目前为止，我正在使用RSelenium提取主页的文本，但我希望切换到像rvest这样的快速解决方案。library(rvest)rvestResults <- read_html(url) %>% value = "//body

浏览 2提问于2019-07-02得票数 0

1回答

RSelenium -如何获取节点的子节点号及其xpath

、、、、

我正在使用RSelenium进行网页抓取。现在，我从一个动态生成的web页面中获得了某个XML节点的xpath。子节点属于同一类型。但是，我没有关于子节点数量的先验知识。1)节点的子节点数。2)上面的xpath。我的目标是在每个子节点中应用操作(例如，填充、检查或单击，这取决于节点的类型)。我在chrome中看到一些使用xpath helper的xpath。优选

浏览 16提问于2016-08-05得票数 0

回答已采纳

点击加载更多