在Python中,Unicode充当着解决各种字符编码问题的桥梁
数据(字符串)与Python程序无非两种关系: 数据流到Python程序中(输入),Python程序流出各种数据(输出)....数据从外部(文件,网络等地方)-->Python程序时
先不急,用一个unicode接住它们,然后再进行之后的各种操作
content = unicode(originalContent, 'src_data_encoding...(encoding) #必须要清楚目的地能接受的编码格式
其他需要知道的
1 Python有时会「自作主张地」转换我们的unicode(以ascii格式),简直stupid,ascii就那么几个字符,肯定经常抛...UnicodeEncodeError啊
2 Python有时能猜到目的地的编码,猜到万幸,没有猜到就抛错误
3 使用Windows_中文版的人需要知道它的cmd控制台是gbk编码的
4 Linux等就好多了...(不只是unicode这一项)
举例
1 Windows_cmd控制台打印unicode
Windows8中文版-Python2.7
s = u'中国人民'
print s #ok,看来Python知道应该使用什么编码