首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >将HTML页面的大小写转换为R中的小写

将HTML页面的大小写转换为R中的小写
EN

Stack Overflow用户
提问于 2018-08-03 20:55:52
回答 1查看 78关注 0票数 1

我需要转换一个HTML页面的所有内容,以降低。但是我得到了一个错误。

代码语言:javascript
复制
library(stringr)
library(httr)
library(XML)

url <- "https://stackoverflow.com/"
request <- GET(url)
doc <- htmlParse(request, encoding = "UTF-8")
doc <- str_to_lower(doc)

as.vector(x,"character")中出现字符错误:无法将类型'externalptr‘强制为类型'character’的向量

我需要保留文档的XML结构,因为我必须使用xpath。

谢谢你的帮忙!

EN

回答 1

Stack Overflow用户

发布于 2018-08-03 23:26:39

您可以尝试将文档转换为字符,更改大小写,然后将解析重复为HTML代码。

代码语言:javascript
复制
library(stringr)
library(httr)
library(XML)

url <- "https://stackoverflow.com/"
request <- GET(url)

#convert to character then covert case
newdoc<-str_to_lower(as.character(request)) 

#reread the new doc to convert back to html   
doc <- htmlParse(newdoc, encoding = "UTF-8")

这应该会创建所需的可读性文档。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51673167

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档