文章/答案/技术大牛

发布

社区首页 >问答首页 >字符串看似是一个空格字符，但事实并非如此

问字符串看似是一个空格字符，但事实并非如此
EN

Stack Overflow用户

提问于 2020-04-17 00:09:46

回答 1查看 30关注 0票数 1

我正在用rvest做一些网页抓取，我遇到了一些奇怪的事情。我在两台电脑上复制了这个字符串，一台运行R3.6.3的Mac系统和一台运行R3.6.3的Windows10系统。

library(rvest)
library(stringr)
# scrape website, no issue
webpage <- rvest::read_html("https://www.usms.org/longdist/ldnats00/1hrf4044.php")
html <- rvest::html_nodes(webpage, css = "td")
results <- rvest::html_text(html)
# cleaning results a bit, no issue
results <- stringr::str_replace(results, "\\\r\\\n", "")
results <- results[results != ""]
# the mystery string
results[605]
[1] " "

如果我将results[605]与" "进行比较，或者与打印results[605]的复制粘贴结果进行比较

results[605] == " "
[1] FALSE

如果我将results[605]存储在一个值中

string_605 <- results[605]
string_605
[1] " "
results[605] == string_605
[1] TRUE
string_605 == " "
[1] FALSE

就像一次理智的检查

" " == " "
[1] TRUE

这个神秘的字符串是什么?我如何匹配它？我想像results <- results[results != mystery string]一样摆脱它

string

rvest

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-04-17 00:26:55

这里的字符串是<U+00A0>

我的解决方案总是尝试clipr::write_clip(results[605])并粘贴到任何位置。然后你可以看到这个字符串的代码也可以粘贴到google中进行搜索:)

在您可以这样做之后，results <- results[results != '\U00A0']

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61254857

复制

相似问题

问字符串看似是一个空格字符，但事实并非如此
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问字符串看似是一个空格字符，但事实并非如此EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问字符串看似是一个空格字符，但事实并非如此
EN