文章/答案/技术大牛

发布

社区首页 >问答首页 >如何将u'\xc3\xa9cosyst\xc3\xa8mes‘解码为utf-8

问如何将u'\xc3\xa9cosyst\xc3\xa8mes‘解码为utf-8
EN

Stack Overflow用户

提问于 2019-03-24 11:26:59

回答 2查看 872关注 0票数 1

通过使用BeautifulSoup进行get抓取，我得到了一个查询字符串参数，该参数最终表示为：

param_value = u'\xc3\xa9cosyst\xc3\xa8mes'

在阅读时，我可以猜到它应该被表示为écosytèmes

我尝试了几种编码/转义/解码的方法(如描述的here和here)

但我总是犯这样的错误：

UnicodeEncodeError('ascii', u'\xc3\xa9cosyst\xc3\xa8mes', 0, 2, 'ordinal not in range(128)')

我还尝试了作为重复提出的解决方案：

Python 2.7.15 (default, Jul 23 2018, 21:27:06)
[GCC 4.2.1 Compatible Apple LLVM 9.1.0 (clang-902.0.39.2)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> s = u'\xc3\xa9cosyst\xc3\xa8mes'
>>> s.encode('latin-1').decode('utf-8')
u'\xe9cosyst\xe8mes'

但这让我回到了第一阶段.

从u'\xc3\xa9cosyst\xc3\xa8mes'到u'écosystèmes'怎么走？

python

python-2.7

encoding

escaping

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-03-24 11:31:07

UTF-8被解码为拉丁语-1，所以解决方案是将其编码为拉丁语-1，然后解码为UTF-8。

>>> s = u'\xc3\xa9cosyst\xc3\xa8mes'
>>> s.encode('latin-1').decode('utf-8')
u'\xe9cosyst\xe8mes'
>>> print s.encode('latin-1').decode('utf-8')
écosystèmes

票数 1

Stack Overflow用户

发布于 2019-03-24 11:31:48

我想这会有帮助的：bytes(u'\xc3\xa9cosyst\xc3\xa8mes', 'latin-1').decode('utf-8')

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55323297

复制

相似问题

问如何将u'\xc3\xa9cosyst\xc3\xa8mes‘解码为utf-8
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将u'\xc3\xa9cosyst\xc3\xa8mes‘解码为utf-8EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将u'\xc3\xa9cosyst\xc3\xa8mes‘解码为utf-8
EN