前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >判断字符编码

判断字符编码

作者头像
Crossin先生
发布2018-04-16 15:05:39
1.8K0
发布2018-04-16 15:05:39
举报

今天本来打算讲点新课的,后来有些事耽搁,也没时间准备了,就分享一个小工具吧:

python里面的字符编码是让人头大的一个东西,甚至很多时候你都不知道现在拿到的文本到底是什么编码。

这时候,chardet可以帮你判断编码。chardet是python的第三方扩展,用来检测字符串或文件的编码。你需要去下载它,搜索“chardet”,或者直接去:

https://pypi.python.org/pypi/chardet

(点击文末的“阅读原文”可直接达到)

下载解压之后,可以把chardet目录(不是直接解压出来的那一层)拷贝到你的代码文件夹下直接调用,也可以把chardet目录拷贝到你的python系统路径Python27\Lib\site-packages下。

使用中,你有一个待检测的字符串s,只需:

import chardet

print chardet.detect(s)

就可以看到输出结果:

{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

confidence是预测这种编码的可能性,encoding是编码名称。

最后再啰嗦一句:新加入的同学,直接发送课程编号,如:11,就可以查看之前的课程噢!

#==== Crossin的编程教室 ====#

面向零基础初学者的编程课

每天5分钟,轻松学编程

回复『 p 』查看python课程

回复『 g 』查看pygame课程

回复『 t 』查看习题

回复『 w 』查看其他文章

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2013-09-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Crossin的编程教室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档