首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何让Python识别德国符号,比如变音符号?

如何让Python识别德国符号,比如变音符号?
EN

Stack Overflow用户
提问于 2014-06-27 06:16:50
回答 2查看 1.9K关注 0票数 0

我读到了这个:python: open and read a file containing germanic umlaut as unicode

我正在使用pd.read_csv()从CSV文件中读取数据帧

\x9f应为元音:

代码语言:javascript
复制
'Heiner Dr\x9fke "Weil, Gotshal & Manges"'

我试过了,但没有用:

代码语言:javascript
复制
person1.encode('utf-8')

UnicodeDecodeError: 'ascii' codec can't decode byte 0x9f in position 9: ordinal not in range(128)

已尝试

代码语言:javascript
复制
I get this when i use macroman person1.decode('macroman')
Out[511]:
u'Heiner Dr\xfcke "Weil, Gotshal & Manges"'

但是,当我打印时,person1.decode('macroman')确实打印出了元音。如何将其捕获到字符串中?

代码语言:javascript
复制
person1.decode("cp1251")
Out[512]:
u'Heiner Dr\u045fke "Weil, Gotshal & Manges"'
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-06-27 06:31:29

不知何故你被编码成了macroman ..。你不应该这样

代码语言:javascript
复制
>>> print 'Heiner Dr\x9fke "Weil, Gotshal & Mages"'.decode("macroman")
Heiner Drüke "Weil, Gotshal & Mages"

这将把它解码成python能理解的unicode ...

如果您想将其编码用于google搜索

代码语言:javascript
复制
'Heiner Dr\x9fke "Weil, Gotshal & Mages"'.decode("macroman").encode('ascii', 'xmlcharrefreplace')

应该可以正常工作

票数 4
EN

Stack Overflow用户

发布于 2014-06-27 09:52:22

根据此referenceu = u"profileDir_(\u00fc)" (u元音)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24441126

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档