html_attr "href“不提取链接_递归提取href链接_如何从href中提取链接 - 腾讯云开发者社区

、、

我想要下载选项卡“档案”中包含文本“模块4”的文件： https://www.g-ba.de/bewertungsverfahren/nutzenbewertung/5/#dossier 首先，我想获得链接/5/#dossier" %>% html_nodes(".gba-download__text") %>% html_attr(&q

浏览 77提问于2020-12-04得票数 1

回答已采纳

1回答

使用rvest提取链接(包括空白行)

我正在尝试使用rvest从表中提取链接。该表还包括没有链接的行。由于我需要将链接连接到原始表，因此需要包括空行。html_attr("href")跳过这些行，这使得不可能将链接合并到原始表。html_nodes(xpath='//*[@id="mw-content-text"]/div/table[3]') %>%

浏览 8提问于2019-04-14得票数 0

回答已采纳

1回答

web从一个表中抓取，文本是我想要的，但是表格中的href链接来自整个页面。如何限制？

我想使用包从其中一个表中提取href链接。当我使用html_table()检查时，我可以抓取一个表并确认我拥有的表是正确的，但是当我在提取的表上使用html_attr(name='href')时，我会得到整个页面上的链接。但是当我提取href链接时，两者都包含相同的整页链接！ t_monday%>% html_nodes(xpath='//a[

浏览 0提问于2017-05-21得票数 2

回答已采纳

1回答

选择正确的html元素

、、

我编辑它是为了添加更多的属性，但是当我尝试添加作者时，我遇到了问题 html_elements(".ds-artifact-item") %>% html_attr("href"), # not download the Authors ht

浏览 7提问于2022-12-02得票数 0

1回答

我正在学习R中的web抓取，在运行代码: error后面对错误

、、

我正在学习R中的web抓取，试图在数学堆栈交换中抓取问题页，并在下面的代码帮助下： html_attr("href") %>% paste("https:/&#x

浏览 3提问于2021-12-06得票数 0

1回答

R:如何使用rvest或任何R包从标签的属性中提取某些元素？

、、、

<table><tr></table>如果我将x设置为以字符串/字符形式出现的上述超文本标记语言hel

浏览 1提问于2021-01-16得票数 0

1回答

如何有效地找到所有事件ID？

、

如何用rvest爬行此数据库以识别每年的所有锦标赛ID？目前，我只是从1:maxx(event_id)开始，这确实消耗了计算时间。结果过滤器在网页上似乎是动态的，所以url不会改变。 event_id = 2483 message('Retrieving Event ',event_id) race_url = paste0('http

浏览 2提问于2022-02-09得票数 0

1回答

用Rvest抓取网页链接

、、

我正在设法从wiki页面中提取链接。, "a[href*='pages']")我想在href之后提取链接

浏览 3提问于2015-09-02得票数 0

2回答

抓取R中的<a>标记链接

、

我试图获得所有的链接，为每个风暴的网页在1998年(链接到下面的风暴列表) storm_html_link <- "https://www.nhc.noaa.gov/<- paste(readLines(storm_html_link), collapse="\n")print(s

浏览 29提问于2018-09-10得票数 1

回答已采纳

1回答

从R中的网页中抓取链接

、

我也想获得到属性的链接--但出于某种原因，我并不是从每个页面获得所有链接，这段代码可以工作，但只适用于第一页。关于link提取，我缺少什么？_aOSG") %>% paste0("https://www.immobilienscout24.at", ., sep="")

浏览 3提问于2022-04-15得票数 0

回答已采纳

1回答

使用str_extract_all从一个字符串中的数百个门户中提取特定门户的发布。

、、、

使用一个简单的代码提取到我的文章的链接(一个一个)url = ("http://www.time.mk/week/2016/22")html_nodes(".other_articles") %>%paste0()mar

浏览 1提问于2017-04-22得票数 0

1回答

如何使用R从启用了javascript的网页中提取链接

、、、、

我正在尝试提取网页上的所有链接："“url_page<-"https://coronavirus.data.gov.uk/archive/"all_links<-html_attr(html_nodes(webpage, "a"), "href") 但是，这会为该网

浏览 1提问于2020-05-31得票数 0

1回答

用html_attr抓取链接(‘href’)

、、

当我试图刮掉所有的标题和他们的链接，我可以得到标题，但没有链接。我试过不同的选择器，但是没有任何东西可以获得链接。对于提供的站点，第一个链接应该是： %>% html_nodes(css = sel) %>% html_text(), link = pg %>% html_nodes(css = sel) %>% html_attr('

浏览 4提问于2020-03-31得票数 0

回答已采纳

1回答

使用rvest获取网页链接

、、

我尝试使用rvest从这个网站中提取"VAI ALLA SCHEDA PRODOTTO“的链接： library(rvest) version.block <- html_nodes(page.source, "a") %>% html_attr("href") 然而，我无法得到任何类似于p=2340487“的链

浏览 1提问于2018-02-09得票数 1

回答已采纳

1回答

使用Rvest从网页中识别所有excel文件

、、

我尝试了几个变体，但没有结果，我认为这与html_elements和html_attr的使用有关。由于某些原因，当尝试使用以下代码选择特定链接时，excel_links为空： html_elements("a") |&g

浏览 2提问于2022-08-03得票数 0

回答已采纳

2回答

使用'rvest‘提取链接

、、、

其中一步是从每个餐厅提取链接。例如，我搜索纽约市的餐馆，得到一些结果。然后我想提取出Yelp在第一页推荐的所有10家餐厅的链接。find_loc=New+York,+NY,+USA")但是代码总是返回'NA‘

浏览 0提问于2016-02-07得票数 20

回答已采纳

1回答

在R中对google进行web抓取时获取链接

、、

我试图获得谷歌的链接，同时做一个搜索，也就是所有这些链接：。 ? +Peña+sl+telefono"content_request %>% html_attr("href") 我尝试过其他节点，也得到了类似的答案： content_request %>% html_nodes(".LC20lb"

浏览 16提问于2019-02-26得票数 1

1回答

R- Web页面抓取-使用rvest获取属性值时出错

、

我试图使用rvest从维基百科中提取ISO国家信息(包括来自另一个页面的链接)。如果不包含名称，我就找不到正确获取链接( href属性)的方法(我已经尝试过xpath字符串函数，它会导致错误)。')links2 <- html_nodes(nodes, xpath = 'tr/td[2]//a[@title]/@href/text()')#Foll

浏览 0提问于2017-10-21得票数 0

回答已采纳

1回答

我在提取页面底部的最大页码/最后一个页码时遇到问题。当我尝试下面的代码时，我不知道我做错了什么。我的目标是提取唯一的页码(当前是96)，如果不可能，那么至少提取包含最后一个页码的href (我可以直接从中获得页码)。currency=CAD&year=1990-2018&length=38-45&price=0-200000") page %>% html_nodes(".nav-next") %>% html_attr(&q

浏览 37提问于2021-05-03得票数 1

回答已采纳

1回答

用rvest从HTML表中提取超链接

、、、、

mp3但是，我也想为"Speech“列中的每个条目提取超链接，该列自然存在于href属性中。我在网上对此进行了相当深入的研究，有些人说也要用html_attr('href')指定html属性，但是如果我在上面的代码中包含了这个属性，我就会得到这样的错误： Error in UseMethod(

浏览 3提问于2017-05-12得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云