首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如果字符串只包含特定的代码页,那么如何签入python?

如果字符串只包含特定的代码页,那么如何签入python?
EN

Stack Overflow用户
提问于 2013-12-03 14:23:44
回答 2查看 1.1K关注 0票数 1

我知道python只使用utf8进行字符串编码,但如果我需要将数据发送到非unicode的旧应用程序,并且只支持windows代码页中包含的这些字符,如windows-1251 (辛酸)等等.因此,在这里,我想检测utf-8字符串是否包含任何不能由给定代码页表示的字符。

EN

Stack Overflow用户

回答已采纳

发布于 2013-12-03 14:32:46

有用于编码检测的库:https://pypi.python.org/pypi/chardet ( Python中的字符编码自动检测)。和你的浏览器一样聪明。(开放源码)

侦测到..。

  • ASCII,UTF-8,UTF-16 (2变体),UTF-32 (4变体)
  • Big5,GB2312,EUC,HZ-GB-2312,ISO2022-cn(繁体和简体中文)
  • EUC-JP,SHIFT_JIS,ISO-2022-JP (日文)
  • EUC-KR,ISO-2022-KR (韩语)
  • KOI8-R,MacCyrillic,IBM855,IBM866,ISO-8859-5,windows-1251 (西里尔)
  • ISO-8859-2,windows-1250 (匈牙利语)
  • ISO-8859-5,windows-1251 (保加利亚文)
  • windows-1252 (英文)
  • ISO-8859-7,windows-1253 (希腊文)
  • ISO-8859-8,windows-1255 (视觉和逻辑希伯来文)
  • TIS-620 (泰语)

文档中的示例:

代码语言:javascript
运行
复制
>>> import urllib
>>> rawdata = urllib.urlopen('http://yahoo.co.jp/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'encoding': 'EUC-JP', 'confidence': 0.99}
票数 2
EN
查看全部 2 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20353716

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档