嗨,我收到了来自via库的文本,当我打印收到的文本时,我看到一些非英语字符为"\u00e7“,它必须是"ç”。我想我需要对文本进行编码和重新解码,但我对python非常陌生,如果这是正确的方法,我就不会这么做。你能指点我的路吗?
发布于 2014-02-08 13:01:18
使用 encoding解码字符串
>>> s = r'\u00e7'
>>> print s
\u00e7
>>> print s.decode('unicode-escape')
ç
>>>
如果sys.stdout.encoding
是ascii
,则打印将引发UnicodeEncodeError
;在这种情况下,显式地对其进行编码:
>>> print s.decode('unicode-escape').encode('utf-8')
ç
https://stackoverflow.com/questions/21646245
复制相似问题