使用rvest从主页获取href (SelectorGadget和检查源代码)

、

我正在使用rvest从杂志“骗局”中抓取一些链接。我用过这段代码 library(rvest) page <- read_html("https://thehustle.co/daily/page/33/") %>% html_nodes(".daily-article-title") %>% html_attr('href') 但是，这将返回30nas的向量。我使用SelectorGadget查找类，所以不确定这里出了什么问题。

浏览 13提问于2021-04-29得票数 0

回答已采纳

2回答

使用R抓取逐个播放的数据

、、、

我目前正在尝试从以下链接中抓取播放条目：https://www.basket.fi/basketball-finland/competitions/game/?game_id=4677793&season_id=110531&league_id=4 我使用SelectorGadget来确定CSS选择器，并以'//td‘结束。但是，当我尝试使用它抓取数据时，html_nodes()返回一个空列表，因此下面的代码返回一个错误。 library("rvest") url <- "https://www.basket.fi/basketball

浏览 27提问于2020-04-27得票数 0

1回答

、、、

我正在使用rvest抓取一个网站(here)。我正在尝试获取列出的所有582个人的URL。例如，其中一个人的网址是here。一旦我在一个单独的URL中，我就能够成功地抓取我正在寻找的信息。下面是一个这样的例子： link = "https://www.supercluster.com/astronauts/jessica-u.-meir?sort=&ascending=false&life%20form=human&" page = read_html(link) # Time in space and spacewalk time page %

浏览 30提问于2021-02-01得票数 0

1回答

如果rvest无法识别R中的节点，该怎么办？

、

我正在尝试用rvest抓取裁判的比赛数据。请参见以下代码： page_ref<-read_html("https://www.pro-football-reference.com/officials/HittMa0r.htm") ref_tab <- page_ref %>% html_node("#games") %>% html_text() #html_table() 但是rvest不能识别链接中“游戏”表的任何节点。它可以很好地从第一个表“季节总数”中提取数据。我是不是漏掉了什么？一般来说，如果rvest

浏览 0提问于2021-01-20得票数 0

1回答

在SelectorGadget不适用的情况下抓取数据表的标题数据？(抓取基本面)

、

这两个页面具有相同的数据表(一个用作备份，如果另一个关闭)。我可以从library(XML)的readHTMLTable()中获取每个页面的表中的列数据，但无法获得表的标题。我所需要的只是日期-年份时间戳(目前是August 2019)，以分配给数据。在我所做的一些小的抓取中，在其他类似的页面上，我已经使用SelectorGadget (https://selectorgadget.com/) Chrome扩展通过输入library(rvest)的html_text()参数来识别要抓取的节点，但是SelectorGadget似乎在这两种情况下都不起作用，所以我对另一种方法一无所知。关于如何

浏览 23提问于2019-09-03得票数 0

回答已采纳

1回答

网络抓取Yougov

、、

我正在尝试使用软件包rvest和工具selectorgadget来擦拭yougov提供的最著名品牌的名称列表。该工具工作良好，但不幸的是，R只是刮前20个品牌名称，即使所有品牌都被选择小工具工具正确选择。我使用的R代码如下： # Packages library("rvest") library("dplyr") # Scraping yougov-Data yougov <- read_html("https://today.yougov.com/ratings/consumer/fame/brands/all") yougov

浏览 5提问于2022-10-25得票数 -1

回答已采纳

2回答

Reddit在使用rvest时只返回25个帖子，而不是100个

、、

我以this guide为例来缩短发布到Reddit的时间。它说使用SelectorGadget工具来绕过学习其他语言，所以这就是我所做的。虽然old.reddit.com上的页面显示了100个帖子(所以应该记录100个不同的时间)，但实际上只从我的代码中提取了25个不同的时间值。下面是我的代码： library(rvest) url <- 'https://old.reddit.com/' rawdata <- read_html(url) rawtime <- html_nodes(rawdata, '.live-timestamp&#

浏览 5提问于2019-01-31得票数 1

1回答

Rvest刮除返回空字符

、、、

目前，我希望使用R (主要是name、CAS Number和molecular weight )从化学数据库中获取一些数据。但是，我很难获得rvest来提取我正在寻找的信息。这是我到目前为止掌握的代码： library(rvest) library(magrittr) # Read HTML code from website # I am using this format because I ultimately hope to pull specific items from several different websites webpage <- read_html(past

浏览 2提问于2017-08-05得票数 2

回答已采纳

1回答

从消费者事务网站上抓取数据

、、

我正在尝试使用Rvest从下载评论。我可以下载文本，但我无法获得评级，因为它是一个图像。有没有办法获得收视率？我使用selectorgadget来获取CSS。 comcast <- read_html("https://www.consumeraffairs.com/cable_tv/comcast_cable.html") rating <- comcast%>% html_nodes(".star-rc span") %>% html_text() rating

浏览 1提问于2017-05-04得票数 1

1回答

R:从工作门户中抓取Web

、

我没有办法尝试从求职门户网站上抓取数据。基本的rvest加上xml2包的使用不会让我达到提取职称、公司、地点、发布日期以及工资下限和上限的目标。下面是我编写代码的原始开始。 library(dplyr) library(rvest) library(xml2) Data <- read_html("https://gehaltsreporter.de/stellenangebote-jobs/?q=Immobilienkaufmann") 使用Selectorgadget工具不能在通常的编码方式下工作，该工具例如将职称(其中包括“Immobilienkaufmann”

浏览 20提问于2021-10-10得票数 0

1回答

rvest html_nodes()返回空字符

、、、、

我正在尝试抓取一个网站(https://genelab-data.ndc.nasa.gov/genelab/projects?page=1&paginate_by=281)。特别是，我正在尝试抓取所有281个“发布日期”(第一个是'30-Oct-2006') 为此，我使用了R包rvest和SelectorGadget Chrome扩展。我使用的是Mac 10.15.6版。我尝试了以下代码： library(rvest) library(httr) library(xml2) library(dplyr) link = "https://genelab-da

浏览 41提问于2020-10-17得票数 1

回答已采纳

1回答

如何正确识别特定的值以使用rvest进行解析

、

亲爱的集体智慧我正努力用rvest来解析来自的表我需要循环遍历表的所有节点并逐个提取它的值。然后迭代到下一页并重复。我打算单独读取表值，因为我需要在代码中添加一个变体循环--对于每一行，如果"Data urodzenia“列中的值等于”，则程序应该输入与该行对应的网页，然后提取其他值(标记为"Rocznik")。就目前而言，我在强迫rvest读取表中的值时遇到了困难。我想我不太遵循html选择器的想法.我能够在以下函数中使用(".museumTableRow")标记读取整个表(每页)： library(rvest) library(tidyve

浏览 6提问于2021-12-16得票数 0

回答已采纳

1回答

抓取dl、dt、dd HTML数据

、、、、

我正在尝试使用Rvest & Selectorgadget从在线搜索中提取公开可用的房屋描述，并尝试遵循几个在线教程来抓取web，但我什么也得不到。如果有人能为我指明正确的方向，我将不胜感激！ Site <- "https://paol.snb.ca/paol.html?lang=en&pan=00100004" snb <- read_html(Site) snb %>% html_nodes("dd") %>% html_text()

浏览 0提问于2018-06-18得票数 0

1回答

利用rvest刮取年度股利收益率

、

正如你可能听说过的，getDividends不再与雅虎合作。因此，我试图从网页上抓取股息数据。特别是，我正试图从链接MSFT 获得2016年年底收益(2.37)。我安装了SelectorGadget，并试图使用rvest来完成任务。我以前没有使用过它，所以我试着遵循说明，我认为tr:nth-child(4) td:nth-child(6)是我需要从SelectorGadget提供给rvest的信息，但这是我陷入困境的地方。我希望能提供任何帮助来说明该如何做。这就是我尝试过的： website<-read_html('http://performance.morningsta

浏览 1提问于2017-04-24得票数 0

回答已采纳

1回答

使用rvest抓取HTML data.table

、

我正在尝试使用R rvest包从中抓取“鱼肉样本”表数据。我使用chrome扩展SelectorGadget来查找表的xpath。我无法从网页中获取任何表格数据到R.非常感谢您的帮助。 library(rvest) urllakes<- read_html("http://www.dnr.state.mn.us/lakefind/showreport.html? downum=27011700") lakesnodes <- html_nodes(urllakes,xpath = '//*[(@id = "lake-survey")]&#

浏览 1提问于2017-10-01得票数 0

回答已采纳

1回答

在rvest包的`html_nodes`函数中使用正则表达式

、、、

我正在尝试创建一个使用rvest包中的html_nodes函数的函数。我的函数接受任何媒体(博客/发布平台)博客主页的URL。它将生成到该特定媒体博客上的每个单独帖子/文章的链接，并将其保存在列表中。然而，每个媒体博客的设计是不同的。因此，SelectorGadget生成的css也会有所不同。有没有什么方法可以使用正则表达式，特别是竖线("|")符号来捕获不同的of，这样我的函数就可以智能地捕获到任何给定媒体博客上的每个单独帖子/文章的链接。我的函数如下： get_url_suffix <- function(url) { url_suffix <- re

浏览 17提问于2021-06-18得票数 0

回答已采纳

1回答

如何从数据中获取值-href

、、、、

我正在尝试抓取一堆链接，或者可以附加到根域以从创建链接的东西 html本身看起来像这样： <div class="container-item listing-layout-item selectorgadget_selected" data-href="/groups/viral-communications/overview/" '=""> <div class="container-item listing-layout-item selectorgadget_suggested" data

浏览 18提问于2018-08-11得票数 0

回答已采纳

1回答

rvest网络抓取hltv

、、、

是的，这只是另一个“如何抓取”的问题。很抱歉，但我已经阅读了之前的答案和rvest的手册。我正在为我的作业做网络搜索(所以我不打算把这些数据用于任何商业问题)。这个想法是为了表明团队的平均技能会影响个人的技能。我正在尝试使用来自HLTV.org的CS:GO数据。有关信息，请访问。我需要两个表: Keystats (仅限数据)和Teammate(数据和URL)。我尝试使用SelectorGadget生成的CSS选择器，并尝试分析网页的源代码。我失败了。我正在做以下工作： library(rvest) library(dplyr) url <- 'http://www.hlt

浏览 3提问于2017-02-15得票数 1

回答已采纳

1回答

Rvest:使用css选择器从URL中的不同选项卡中提取数据

、、

我是一个非常新的抓取，并试图从这个网站的一部分- 的数据。我试图获取的数据在第二个选项卡“匹配”中，是标题为“即将到来的比赛”的部分。我试着用SelectorGadget和rvest来做这件事，如下所示- library(rvest) url <- ("https://projects.fivethirtyeight.com/soccer-predictions/premier-league/") url %>% html_nodes(".prob, .name") %>% html_text() 这将返回值，无论该值与页面上的第

浏览 7提问于2022-03-17得票数 0

回答已采纳

1回答

用rvest抓取图像标题

、、

我试图使用R和SelectorGadget中的rvest包来识别我的CSS选择器，从Glassdoor ( API只提供摘要评级)中提取单个评级。问题是玻璃门使用图像来传达评级，但是数字评级包含在图像标题中。使用SelectorGadget，我可以从下面的代码片段(使用“#EmployerReview未修饰的li")中刮取"Comp &效益”文本，但我无法进入span...title=部分中的"2.0“，这正是我想要的。 <div id='EmployerReviews'> .... <ul class='undeco

浏览 2提问于2015-02-05得票数 2

回答已采纳

2回答

html_nodes返回空列表和字符串，wield网站

、、、

对于这个网站：，我使用R和rvest软件包刮名称，摘要等，这类信息，以我自己的形式。我和其他网站都这样做过，而且真的很成功，但是这个很奇怪。我使用了SelectorGadget，这是有用的，在我以前的工作，以确定css节点的名称，但html_nodes和html_text返回空字符，我不知道这是不是因为网站的结构是完全不同的格式！ css代码的一个示例： td class="all sorting_1">a class="coin_name" href="007coin">007Coin /a>/td> a class

浏览 1提问于2019-07-15得票数 1

回答已采纳

2回答

查找要在页面中使用rvest刮刮的正确属性

、、、

我试图在网页上刮掉底层的超链接，但是选择html节点和相应的属性并没有给出任何结果。我不知道数据是否存储在元标记中，也不知道如何识别。使用selectorgadget，我认为css选择器是“td”，但我也可以在页面中看到“tr”。打开dev工具，我可以看到href属性下的链接，但在运行以下代码时不会得到结果： library(rvest) url = "https://www.firstrand.co.za/investors/debt-investor-centre/jse-listed-instruments/" read_html(url) %>% htm

浏览 6提问于2022-03-27得票数 1

1回答

脸书上的R，rvest和selectorGadget

、、、、

我对脸书上的rvest有意见。我之前用过很多关于R的东西，所以我理解了例如html_nodes是如何工作的。我总是使用SelectorGadget，一切都能正常工作。这一次，SelectorGadget在Facebook网站上不起作用，所以我不得不处理html。假设我有这个网站的，我想提取文章的标题('Karnawałowe stylizacje F&F')。我该怎么做呢？到目前为止我已经尝试过了： library("rvest") link_fb <- "http://www.fb.com/103052579736517_10179

浏览 1提问于2015-12-18得票数 2

2回答

如何使用R在html中的注释标记内刮表？

、、、、

我正在尝试使用rvest从中获取数据。我使用了selectorgadget，并发现标记为我想要的表的#高级。但是，我注意到它不是捡起来的。查看页面源代码，我注意到这些表位于html注释标记<!--中。从注释标记中获取表的最佳方法是什么？谢谢! 编辑:我正在尝试拉出“高级”表：

浏览 5提问于2016-11-15得票数 6

回答已采纳

1回答

在h3类中选择标题-使用rvest的Css选择器

、、

我正在尝试使用R和SelectorGadget中的rvest包来提取标题描述，以识别我的CSS选择器。 <div class="detail"> <h3 class=""> <a href="[].html" title="Vasyl Lomachenko Beats Guillermo Rigondeaux" class=&

浏览 0提问于2018-01-07得票数 0

1回答

and抓取选择器小工具和rvest的问题

、、、

我正在尝试使用SelectorGadget和rvest从https://3g.dxy.cn/newh5/view/pneumonia中抓取数据我用下面的代码成功地抓取了页面中的一些文本。 library(rvest) url <- 'https://3g.dxy.cn/newh5/view/pneumonia' webpage <- read_html(url) TEXT_html <- html_nodes(webpage,'.descText___Ui3tV') TEXT <- html_text(

浏览 16提问于2020-01-28得票数 1

回答已采纳

2回答

R中的WebScraping动态页

、

我会改变网站，把这个问题做得更好。仍然面临着类似的问题，不能只使用rvest包，也许用RSelenium可以更容易地获得答案。网站：和我想从主要文章获得链接，这将引导我到个人比赛结果。链接看起来像这样：我正在尝试使用简单的Rvest，因为我认为这是这里所需要的。SelectorGadget以.article-title a的形式给出了链接CSS，所以我的代码很简单 url %>% read_html() %>% html_nodes(".article-title a") %>% html_text() 这将不会返回任何内容。当你向下滚动时，

浏览 1提问于2017-08-09得票数 0

回答已采纳

1回答

使用rvest对Google搜索结果进行when抓取时出现字符(0)错误

、、、

我正在尝试抓取谷歌搜索的标题。然而，不管我用rvest做什么尝试，结果总是返回character(0)。以下是搜索rstudio的代码 library(rvest) library(dplyr) web1 <- read_html("https://www.google.at/search?q=rstudio") header <-web1 %>% html_nodes(".DKV0Md") %>% html_text() header 我在SelectorGadget中检查了节点名，所以这应该不是问题。我该如何

浏览 25提问于2020-10-18得票数 2

回答已采纳

1回答

R- Web抓取商品价格

、

我试图写一个R脚本检查价格在一个受欢迎的瑞士网站。这里解释了以下方法： I试图为此使用rvest： library(rvest) url <- "https://www.galaxus.ch/fr/s8/product/quiksilver-everyday-stretch-l-shorts-de-bain-10246344" webpage <- read_html(url) 不幸的是，我的html/css知识有限，webpage的内容对我来说非常模糊。我试着用google检查页面，看起来价格就在一个名为priceEnergyWrapper--2ZNIJ的

浏览 0提问于2019-07-19得票数 0

回答已采纳

1回答

Rvest和SelectorGadget导致空表

、

我正在尝试使用rvest和SelectorGadget从下载几个表。 css选择器是"#main li“，从下面的截图中可以看到。当我运行下面的代码时，不幸的是，结果是一个空表。 library(rvest) psh <- read_html("https://pershingsquareholdings.com/performance/net-asset-value-and-returns/") psh.node <- html_node(psh, "#main li") psh.table = html_table(p

浏览 7提问于2022-10-29得票数 0

2回答

如何使用R抓取NSE指数(NIFTY 50)的基本数据

、、、、

我正在尝试从nse网站(link)上获取基本面数据表(市盈率、市盈率和股息率)。我从rvest包中尝试了以下内容： url = "https://www1.nseindia.com/products/content/equities/indices/historical_pepb.htm" pgsession <-html_session(url) 但是，我收到这个错误： Error in curl::curl_fetch_memory(url, handle = handle) : LibreSSL SSL_read: SSL_ERROR_SYSCALL, errno

浏览 16提问于2020-06-23得票数 0

回答已采纳

1回答

使用SelectorGadget获取数据集

、、

我试图从这个网站获取夏威夷特有的数据：。我想从网站上的每一张桌子上得到夏威夷的数据。这是在选择State选项卡之后完成的。在R中，我试图在SelectorGadget中使用rvest库。到目前为止我已经试过了 library(rvest) html <- read_html("https://www.opentable.com/state-of-industry") html %>% html_element("tbody") %>% html_table() 然而，这并没有给我我正在寻找的东西。我得到的是全球

浏览 0提问于2021-07-20得票数 0

回答已采纳

1回答

使用rvest进行网络抓取不能正常工作

、

我想从airbnb的网页上浏览房间的评论。例如，从这个网页：这是我完成这项任务的代码。我使用了rvest和selectorgadget： x <- read_html('https://www.airbnb.com/rooms/8400275') x_1 <- x%>%html_node('#reviews p')%>%html_text()%>%as.character() 你能帮我修一下吗？是否可以使用租赁包(我对xpathSApply不熟悉)

浏览 1提问于2016-05-11得票数 0

回答已采纳

1回答

在R中从HTML中抓取实时更新值

、

我正在尝试从这样的页面中抓取值: R中的，目前正在使用rvest。具体来说，我要的是当前的价格和隐含的波动性。使用SelectorGadget工具，我能够找到这些值所需的节点。使用以下方法，我能够得到隐含的波动率： library(rvest) html <- read_html("https://www.barchart.com/futures/quotes/CBX22/options/nov-22") html_text(html_nodes(html, '.text-medium-up-center strong')) [1] "43.

浏览 3提问于2022-09-19得票数 0

回答已采纳

1回答

Chrome DevTools:循环通过NodeList

、、、、

在一个页面上，我有一个包含多行(大多数是100行)的表，每行都有多列。每一行都有一个带有类.no-red的锚点。我正在使用chrome dev工具控制台获取这个锚元素，使用 document.querySelectorAll('.no-red') 这将返回一个数组 NodeList(100) [a.no-red.selectorgadget_selected, a.no-red.selectorgadget_suggested, a.no-red.selectorgadget_suggested, a.no-red.selectorgadget_suggested, a.

浏览 0提问于2018-03-23得票数 2

1回答

路透社数据在R中与rvest擦拭，查找CSS选择器

、、、、

是的，我知道有类似的问题，我读过答案，并尝试了那些我可以实施的问题。所以，如果问题是愚蠢的，请提前道歉:) 我正在从路透社( Reuters )中搜集公司董事会成员的年龄，以获得一份公司名单。下面是链接：我正在使用rvest库和selectorgadget来找到合适的CSS选择器。下面是代码： library(rvest) d = read_html("http://www.reuters.com/finance/stocks/companyOfficers?symbol=GAZP.RTS") d %>% html_nodes("#companyNews:nt

浏览 2提问于2016-12-04得票数 0

回答已采纳

1回答

使用R和selectorgadget进行HTML抓取

我有一个下面的脚本，用于简单的html抓取。下面不会为这个特定的站点返回任何内容。在R和selectorgadget中使用html是新手，但我还有其他网站可以使用。我想知道为什么这个看不到元素。下面的图片在高亮显示的红色方框中有路径，我很好奇它是不是因为花哨的方框前的#而隐藏。任何提示和语言纠正都将是有帮助的，因为我仍在学习如何抓取html。 ? library(rvest) library(dplyr) library(tm) library(stringi) library(readr) url <- read_html('https://www.draftkings

浏览 26提问于2020-01-05得票数 0

回答已采纳

1回答

使用'rvest‘和SelectorGadget从网页中寻找文本

、

我正试着从网页上得到一条短信。为了简化我的问题，让我以@RonakShah的Stackoverflow帐户为例来提取声誉值。在显示"div，div“的'SelectorGadget‘时，我使用了以下代码： library(rvest) so <- read_html('https://stackoverflow.com/users/3962914/ronak-shah') %>% html_nodes("div") %>% html_nodes("div") %>% html_text() 这给了一个对

浏览 0提问于2021-03-02得票数 1

回答已采纳

1回答

是否可以单击激活div并显示用于抓取的新内容的选项卡？

、、

我刚开始租车，我正试图确定是否可以使用rvest来单击激活div的选项卡，这样就可以对数据进行抓取。我一直在阅读cran上的，没有读到任何关于单击链接、按钮或标签的内容。我感兴趣的网站是：在主页上，我想单击“竞赛”按钮(同样，您如何在rvest中使用clik按钮) 接下来，我想选择一场即将到来的比赛。这应该使我重定向到选定的比赛的网址。例如：一旦进入竞赛页面，我想单击Pool选项卡并刮取池信息。我在下面附上了一些屏幕截图。如有任何建议，请给予指导。从主页-点击比赛按钮从比赛页面-点击即将到来的比赛从特定的种族页面-点击池标签在池数据(Div)可见-刮池数据。

浏览 7提问于2016-07-14得票数 9

回答已采纳

2回答

rvest::html_nodes返回部分列表(只有几个项目)

、、、

使用rvest包，我试图从电影JFK (https://www.imdb.com/title/tt0102138/fullcredits?ref_=tt_ql_1)的IMDB页面上抓取男女演员的名字。 SelectorGadget说我要找的地方是每个人的"td:nth-child(2)“。这是我正在使用的代码。 library(rvest) library(stringr) startFilm <- "tt0102138" #JFK personsNames <- c()

浏览 50提问于2020-01-20得票数 2

回答已采纳

2回答

R抓取html表格并提取背景色。

、、

我正试图从维基百科的一个表格中摘取一些数据：和我对2014年印度大选摘要表感兴趣我也想从桌子上提取派对的颜色。到目前为止，我尝试过的是： library("rvest") url <- "https://en.wikipedia.org/wiki/Results_of_the_Indian_general_election,_2014" electionstats <- read_html(url) results <- html_nodes(electionstats, xpath='//*[@id="mw-conten

浏览 1提问于2018-01-11得票数 1

回答已采纳

1回答

从Javascript弹出窗口中使用R抓取数据

、、

我想从这个站点上抓取名为" Constraints“的弹出窗口的内容： (单击左侧的Constraints链接后会显示弹出窗口)。我需要获得如下所示的约束、意外情况和影子价格数据。使用SelectorGadget，我将该信息标识为"#frmConstraints\:tblConstraints_data .col-left“ 我可以在这里看到我想要的信息(带有类“col-left”的信息)：我运行了这个R代码，但没有用。const_info未返回任何内容。 library(rvest) library(stringr) library(plyr) libra

浏览 0提问于2018-02-28得票数 1

1回答

从R中的表中刮取数据，找不到里面的数据

、、、

我试图从这里给出的表格中刮取航班到达数据，在R中使用rvest。不管我用什么来查找数据(SelectorGadget，用铬进行手动检查，使用邮递员程序)，我似乎找不到表中显示的数据，我得到的最接近的是通过跟踪它的选择器得到表的标题。我怀疑其中包含了javascript，但我不确定如何在R中处理这个问题，有人有什么建议吗？帮助。

浏览 0提问于2018-12-18得票数 0

回答已采纳

1回答

使用R从aspx网页中提取数据

、、

我想从一个'aspx‘页面中提取数据(我不是网页格式专家)：更准确地说，我想提取每艘船的信息，单击行左侧的“信息”按钮即可访问。我的问题是，在“aspx”页面中，URL总是相同的，所以我不明白如何才能访问每艘船的信息。我知道如何从“标准”网页中提取数据，那么我需要如何修改以下代码(这些页面显示的信息与“aspx”页面相似，但更有限)？ library(rvest) Url <- "http://www.ffvoile.fr/ffv/public/Application1/Habitable/HN_Detail.asp?Matricule=1" Page

浏览 1提问于2018-03-07得票数 1

1回答

R-使用rvest搜索Google +评论

、、、

作为一个项目的一部分，我试图从Google +抓取完整的评论(在其他网站上的尝试中，我的评论被More截断了，除非你点击它，否则它会隐藏完整的评论)。我已经为这个选择了包裹租金。然而，我似乎没有得到我想要的结果。这是我的脚步声 library(rvest) library(xml2) library(RSelenium) queens <- read_html("https://www.google.co.uk/search?q=queen%27s+hospital+romford&oq=queen%27s+hospitql+&aqs=chrome.1.69

浏览 0提问于2018-05-04得票数 1

回答已采纳

1回答

谷歌玩网络抓取:你如何才能得到R的每一次评论的票数？

、、、

我正在做一个谷歌游戏应用的评论，但我无法获得的票数。我指出了代码：喜闻乐见<- html_obj %>% html_nodes(".xjKiLb") %>% html_attr(“aria-标签”)，而我没有得到任何值。怎么做呢？获得零票全码 #Loading the rvest package library(rvest) library(magrittr) # for the '%>%' pipe symbols library(RSelenium) # to get the loaded html of url

浏览 6提问于2019-11-07得票数 0

回答已采纳

1回答

rvest套餐收割instagram粉丝数量？

、、

我正在尝试修改rvest包中的示例代码，以获取instagram (例如，https://www.instagram.com/bradyellison/)上某个帐户的关注者数量。我尝试使用selectorgadget来隔离关注者数量的代码，得到的结果是：._218yx:nth-child(2) ._s53mj。但是我没有得到预期的追随者，也不确定如何调试它。这是我的代码。 # example require(rvest) html <- read_html("https://www.instagram.com/bradyellison/") athlete_follow

浏览 1提问于2016-08-08得票数 0

回答已采纳

1回答

R中的Web抓取问题

我正试图从网站上提取2017年和2018年大学排名的数据。我试图在R中运行一个代码，但是它给了我一个错误。我的代码：- library(rvest) #Specifying the url for desired website to be scrapped url <-"https://www.timeshighereducation.com/world-university-rankings/2018/world-ranking#!/page/0/length/-1/sort_by/scores_international_outlook/sort_order/asc/c

浏览 1提问于2018-04-16得票数 0

2回答

选择小工具是如何工作的？

、、

selectorgadget.com是如何工作的？有没有任何链接/页面来解释selectorgadget背后的算法？谢谢

浏览 3提问于2010-03-27得票数 1

1回答

如何在下面的页面中获取链接并将其存储在变量中？

、、

我的目标是从一个页面中提取所有链接并存储它，这样我就可以设计另一个爬虫来从它们中提取信息，并且有一个详尽的相关链接列表。然而，似乎我并没有将爬虫指向正确的方向来提取这些链接，因为我得到了一个空列表。 “”“ class ArticleSpider(scrapy.Spider): name = 'links' start_urls = [ 'https://abcnews.go.com/search?searchtext=Coronavirus&type=Story&sort=date' ] def pa

浏览 3提问于2020-11-26得票数 0

回答已采纳