前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python中的编码

Python中的编码

作者头像
Tyan
发布2017-12-29 10:37:05
9520
发布2017-12-29 10:37:05
举报
文章被收录于专栏:SnailTyanSnailTyan

Python处理字符串,写文件时会碰到许多的编码问题,特别是涉及到中文的时候,非常烦人,但又不得不学。下面主要记录工作过程中碰到的Python编码问题。

1. 字符串编码

Python的字符串类型为str,可以通过type函数查看返回的类型。Python中字符串默认的编码方式需要通过sys.getfilesystemencoding()查看,通常是utf-8u'中文'构造出来的是unicode类型,不是str类型。

代码语言:javascript
复制
# 查看字符串编码方式
>>> import sys
>>> print sys.getfilesystemencoding()
utf-8

>>> s1 = '中国'
>>> s2 = u'中国'
>>> type(s1)
<type 'str'>
>>> type(s2)
<type 'unicode'>

str类型和unicode类型分别有decodeencode函数。str.decode用来将str转为unicodeunicode.encode用来将unicdoe转为str。用法如下:

代码语言:javascript
复制
# decode
>>> s1.decode('utf8')
u'\u4e2d\u56fd'
>>> type(s1.decode('utf8'))
<type 'unicode'>

# encode
>>> s2.encode('utf8')
'\xe4\xb8\xad\xe5\x9b\xbd'
>>> type(s2.encode('utf8'))
<type 'str'>

2. 代码文件编码

py文件默认的编码是ASCII编码,中文显示时会进行ASCII编码到系统默认编码的转换,在运行Python文件时经常会报错。因此需要设置py文件的编码为utf-8。设置方式如下:

代码语言:javascript
复制
# _*_ coding: utf-8 _*_        
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017-09-07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 字符串编码
  • 2. 代码文件编码
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档