首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何使用Rselenium读取html表格?

如何使用Rselenium读取html表格?
EN

Stack Overflow用户
提问于 2015-04-29 08:57:16
回答 2查看 6.6K关注 0票数 12

我正在使用Rselenium导航到一个网页。下面的代码就是这样做的。我没有提供url,因为我在一家需要vpn连接的公司中使用url:

代码语言:javascript
复制
RSelenium::startServer()
require(RSelenium)
remDr <- remoteDriver()
remDr$navigate("some url")

在我导航到网页之后,在html源代码中,我有一个下表:

代码语言:javascript
复制
<font size="2">
<table border="1">
<tbody>
<tr>
<td> item1 </td>
<td> 0 </td>
<td> 0.05 </td>
<td> 2.43 </td>
<td align="center"> Pct </td>
<td align="center"> 1 </td>
</tr>
</tbody>
</table>

现在的问题是,我如何提取这个表的内容?请假定url不存在,否则我可以使用XML函数: readHTMLTable(remDr$getCurrentUrl())。但由于某些原因,这并不起作用。我只需要使用remoteDriver句柄(remDr)。非常感谢您抽出时间来

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-04-29 09:53:19

类似于:

代码语言:javascript
复制
library(XML)
doc <- htmlParse(remDr$getPageSource()[[1]])
readHTMLTable(doc)

应该允许您访问html并处理包含的表。

票数 18
EN

Stack Overflow用户

发布于 2020-05-18 20:06:54

我更喜欢使用rvest,所以我所做的是:

代码语言:javascript
复制
# Importing libraries
library(RSelenium)
library(rvest)

# Extracting table
remDr$getPageSource()[[1]] %>% 
  read_html() %>%
  html_table()
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29932542

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档