Python中的编码

Python处理字符串,写文件时会碰到许多的编码问题,特别是涉及到中文的时候,非常烦人,但又不得不学。下面主要记录工作过程中碰到的Python编码问题。

1. 字符串编码

Python的字符串类型为str,可以通过type函数查看返回的类型。Python中字符串默认的编码方式需要通过sys.getfilesystemencoding()查看,通常是utf-8u'中文'构造出来的是unicode类型,不是str类型。

# 查看字符串编码方式
>>> import sys
>>> print sys.getfilesystemencoding()
utf-8

>>> s1 = '中国'
>>> s2 = u'中国'
>>> type(s1)
<type 'str'>
>>> type(s2)
<type 'unicode'>

str类型和unicode类型分别有decodeencode函数。str.decode用来将str转为unicodeunicode.encode用来将unicdoe转为str。用法如下:

# decode
>>> s1.decode('utf8')
u'\u4e2d\u56fd'
>>> type(s1.decode('utf8'))
<type 'unicode'>

# encode
>>> s2.encode('utf8')
'\xe4\xb8\xad\xe5\x9b\xbd'
>>> type(s2.encode('utf8'))
<type 'str'>

2. 代码文件编码

py文件默认的编码是ASCII编码,中文显示时会进行ASCII编码到系统默认编码的转换,在运行Python文件时经常会报错。因此需要设置py文件的编码为utf-8。设置方式如下:

# _*_ coding: utf-8 _*_        

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏十月梦想

字符串对象位置相关操作

652
来自专栏数据结构笔记

python爬虫系列之数据的存储(一):json库的使用

在上一篇文章里我们讲了 xpath写法的问题还以爬取我的文章信息写了示例,但是在上一篇中我们只是爬取并打印了信息,并没有对信息进行保存。

672
来自专栏desperate633

第7课 创建计算字段拼接字段执行简单的算术运算

什么是计算字段? 就是直接从数据库中检索出转换,计算或者格式化的数据,而不是检索出数据之后,再在客户端应用程序中重新格式化。

612
来自专栏linjinhe的专栏

Linux常用命令:sort

1296
来自专栏技术博文

bash脚本 while语法

基本语法(比较常见的两种形式): 只要特定条件为真,”while” 语句就会执行 while [ condition ] do command1 c...

2635
来自专栏python3

python语句-中断循环-continue,break

continue的作用是:从continue语句开始到循环结束,之间所有的语句都不执行,直接从一下次循环重新开始

553
来自专栏上善若水

040android初级篇之标准java版的HelloWorld编译及运行

运行的时候,如果 .class文件不在当前目录则需要使用-classpath 指定所在目录。

573
来自专栏nummy

__import__详解

当使用import导入Python模块的时候,默认调用的是__import__()函数。直接使用该函数的情况很少见,一般用于动态加载模块。

662
来自专栏电光石火

获取URL地址中的GET参数

/*-----------------实现1--------------------*/ function getPar(par){ //获取当前URL...

1839
来自专栏从零开始学自动化测试

python笔记20-获取当前运行函数名

写完代码之后,一般为了方便查看日志,可以在日志输出中加入当前运行的函数名称或类和方法名称,以便于代码报错的时候能快速找到报错的是哪个函数或方法。 那么如何获取当...

761

扫码关注云+社区