python2不是以unicode作为基本代码字符类型,碰到乱码的几率是远远高于python3,但即便如此,相信很多人,也不想随意的迁移到python3,这里就总结几个我平常碰到的问题及解法。
# -*- coding=UTF-8 -*-
,一般加在文件头部第一行,如果第一行是脚本标志,则放在第二行(实际仍然是python正本的第一行)。
随后将文件另存为UTF-8格式。
此方法可以解决注释中有中文,及字符串立即数中包含中文的问题。print ', '.join(a)
还可以使用第三方的包,比如:
import uniout ... listnine = ['梨', '橘子', '苹果', '香蕉'] print 'listnine list: %s' % listninea = u'汉字'
这样方式赋值的变量都是Unicode字符串,不会有问题。
如果是从外部传入的变量,源头情况又不知道,可以尝试转换成Unicode字符串:
str=unicode(str,"utf-8");嗯,差不多就这些,想到再补充。