假设我有以下两个变量:
bob1 = u'bob\xf0\xa4\xad\xa2'
bob2 = 'bob\xf0\xa4\xad\xa2'
如何让bob1
的值成为bob2
的值?也就是说,如何在保留转义的十六进制值的情况下展开unicode格式?
如果我这样做:
bob1.encode('utf8')
'bob\xc3\xb0\xc2\xa4\xc2\xad\xc2\xa2'
这是不对的..。
帮助!
发布于 2010-11-25 05:28:10
在ISO8859-1或拉丁文1编码中,U+0000和U+00FF之间的码位映射到相同的字节值。
>>> u'bob\xf0\xa4\xad\xa2'.encode('latin-1')
'bob\xf0\xa4\xad\xa2'
https://stackoverflow.com/questions/4271670
复制相似问题