我正在使用Go和golang.org/x/net/html
包解析一个超文本标记语言文档。当我提取一些节点中的文本字段时,我想用一个简单的空格替换所有出现的 
。
我的谷歌搜索显示, 
是unicode 0xA0
,所以我这样做了:
strings.ReplaceAll(node.Data, "\xA0", " ")
但是结果字符串似乎包含一些未知的字节(当我打印它时,它打印的是�
)。
我做错了什么?
发布于 2021-01-02 03:51:31
Unicode代码点0xA0被UTF-8编码为字节0xc2、0xa0,而不是问题中假设的单个字节0xa0。
使用"\u00a0"
获取不间断空格的UTF8编码。
strings.ReplaceAll(node.Data, "\u00a0", " ")
https://stackoverflow.com/questions/65533097
复制相似问题