我读到了这个:python: open and read a file containing germanic umlaut as unicode
我正在使用pd.read_csv()
从CSV文件中读取数据帧
\x9f
应为元音:
'Heiner Dr\x9fke "Weil, Gotshal & Manges"'
我试过了,但没有用:
person1.encode('utf-8')
UnicodeDecodeError: 'ascii' codec can't decode byte 0x9f in position 9: ordinal not in range(128)
已尝试
I get this when i use macroman person1.decode('macroman')
Out[511]:
u'Heiner Dr\xfcke "Weil, Gotshal & Manges"'
但是,当我打印时,person1.decode('macroman')
确实打印出了元音。如何将其捕获到字符串中?
person1.decode("cp1251")
Out[512]:
u'Heiner Dr\u045fke "Weil, Gotshal & Manges"'
发布于 2014-06-27 06:31:29
不知何故你被编码成了macroman ..。你不应该这样
>>> print 'Heiner Dr\x9fke "Weil, Gotshal & Mages"'.decode("macroman")
Heiner Drüke "Weil, Gotshal & Mages"
这将把它解码成python能理解的unicode ...
如果您想将其编码用于google搜索
'Heiner Dr\x9fke "Weil, Gotshal & Mages"'.decode("macroman").encode('ascii', 'xmlcharrefreplace')
应该可以正常工作
发布于 2014-06-27 09:52:22
根据此reference的u = u"profileDir_(\u00fc)"
(u元音)
https://stackoverflow.com/questions/24441126
复制相似问题