下面显示的每对代码中的第一行可以在macOS、Linux和Windows上运行。但是,R包中不允许在代码中包含非ascii字符。每对中的第二行可以在macOS和Linux上运行,但不能在Windows上运行。 如果能有一种通用的方法来处理这些类型的字符,而不是简单地删除它们,那就太好了。gsub("•", "*", "A big dot •")
gsub("\xE2\x80\xA2", "*", "A big dot •"
我用Python发送了一个Linux命令vi os.system。我发送的命令包含一个破折号参数(-archive_dir),但是该命令在系统中是不可识别的,因为它将破折号视为\xe2\x80\x93。如何做破折号,这样破折号就被看作是一个破折号?#cmd im sending\xe2\x80\x93archive_dir <---what linux system sees.
我有这样的unicode字符串
mm = u'A\xe2\x80\x8ct\xe2\x80\x8ch\xe2\x80\x8c\xe2\x80\x8c\xe2\x80\x8c\xe2\x80\x8c\xe2\x80\x8c\xe2\x80\x8cl\xe2\x80\x8c\xe2\x80\x8c\xe2\x80\x8ce\xe2\x80\x8c\xe2\x80</e