文章/答案/技术大牛

发布

社区首页 >问答首页 >如果字符串只包含特定的代码页，那么如何签入python？

问如果字符串只包含特定的代码页，那么如何签入python？
EN

Stack Overflow用户

提问于 2013-12-03 14:23:44

回答 2查看 1.1K关注 0票数 1

我知道python只使用utf8进行字符串编码，但如果我需要将数据发送到非unicode的旧应用程序，并且只支持windows代码页中包含的这些字符，如windows-1251 (辛酸)等等.因此，在这里，我想检测utf-8字符串是否包含任何不能由给定代码页表示的字符。

python

python-3.x

encoding

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-12-03 14:32:46

有用于编码检测的库：https://pypi.python.org/pypi/chardet ( Python中的字符编码自动检测)。和你的浏览器一样聪明。(开放源码)

侦测到..。

ASCII，UTF-8，UTF-16 (2变体)，UTF-32 (4变体)
Big5，GB2312，EUC，HZ-GB-2312，ISO2022-cn(繁体和简体中文)
EUC-JP，SHIFT_JIS，ISO-2022-JP (日文)
EUC-KR，ISO-2022-KR (韩语)
KOI8-R，MacCyrillic，IBM855，IBM866，ISO-8859-5，windows-1251 (西里尔)
ISO-8859-2，windows-1250 (匈牙利语)
ISO-8859-5，windows-1251 (保加利亚文)
windows-1252 (英文)
ISO-8859-7，windows-1253 (希腊文)
ISO-8859-8，windows-1255 (视觉和逻辑希伯来文)
TIS-620 (泰语)

文档中的示例：

>>> import urllib
>>> rawdata = urllib.urlopen('http://yahoo.co.jp/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'encoding': 'EUC-JP', 'confidence': 0.99}

票数 2

Stack Overflow用户

发布于 2013-12-03 14:26:21

其中，blah是您的字符串，ascii是您的编码：

blah = u'\uffff'
try:
    blah.encode('ascii')
except UnicodeEncodeError:
    # nope - can't do it...

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/20353716

复制

相似问题

问如果字符串只包含特定的代码页，那么如何签入python？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果字符串只包含特定的代码页，那么如何签入python？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果字符串只包含特定的代码页，那么如何签入python？
EN