首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在rvest中跟踪某个id元素的链接?

如何在rvest中跟踪某个id元素的链接?
EN

Stack Overflow用户
提问于 2018-08-27 12:57:21
回答 1查看 312关注 0票数 0

我目前正在美化这个网站:

https://uws-community.symplicity.com/index.php?s=student_group

因此,网站上的每个俱乐部都有一个特定的id,还有一个“更多信息”链接。我已经找到了从div.grpl-grp.clearfix类中抓取每个id的方法,但我想使用这些id从具有特定id的元素的"more info“链接(例如fb链接)中抓取数据。

这样做的语法是什么?

EN

回答 1

Stack Overflow用户

发布于 2018-08-27 13:08:13

“更多信息”文本的类是“grpl-More in”,链接在<a>标记中。所以我们可以这样做

代码语言:javascript
运行
复制
library(rvest)

url <- 'https://uws-community.symplicity.com/index.php?s=student_group'
page <- html_session(url)
html_nodes(page, "li.grpl-moreinfo a") %>% html_attr("href")

#[1] "?mode=form&id=5bf9ea61bc46eaeff075cf8043c27c92&tab=profile"
#[2] "?mode=form&id=17e4ea613be85fe019efcf728fb6361d&tab=profile"
#[3] "?mode=form&id=d593eb48fe26d58f616515366a1e677b&tab=profile"
...

这也可以在一个链操作中完成,如:

代码语言:javascript
运行
复制
url %>%
  read_html() %>%
  html_nodes("li.grpl-moreinfo a") %>%
  html_attr("href")

#[1] "?mode=form&id=5bf9ea61bc46eaeff075cf8043c27c92&tab=profile"
#[2] "?mode=form&id=17e4ea613be85fe019efcf728fb6361d&tab=profile"
#[3] "?mode=form&id=d593eb48fe26d58f616515366a1e677b&tab=profile"
...
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52032772

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档