首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >在html页面上使用rvest和xpath时不返回任何内容

在html页面上使用rvest和xpath时不返回任何内容
EN

Stack Overflow用户
提问于 2018-06-20 23:56:41
回答 1查看 547关注 0票数 0

我使用xpath和rvest来抓取htm页面。rvest的其他示例可以很好地使用管道,但是对于这个特定的脚本,不会返回任何内容。

代码语言:javascript
复制
    webpage <- read_html("https://www.sec.gov/litigation/admin/34-45135.htm")
    whomst <- webpage %>% html_nodes(xpath = '/html/body/table[2]/tbody/tr/td[3]/font/p[1]/table/tbody/tr/td[1]/p[2]') 

返回的内容为:

代码语言:javascript
复制
   {xml_nodeset (0)}

下面是该页面的屏幕截图和相应的html

这是我所在的页面:https://www.sec.gov/litigation/admin/34-45135.htm。我在试着提取“顶峰控股公司”这句话

EN

回答 1

Stack Overflow用户

发布于 2018-06-22 07:10:28

有时chrome工具不能给出准确的xpath或css,你需要自己尝试,这个选择器可以工作:

代码语言:javascript
复制
webpage %>% html_nodes("td > p:nth-child(3)") %>% html_text()

结果:

代码语言:javascript
复制
[1] "PINNACLE HOLDINGS, INC.,   \n    
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50952434

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档