unicode
类型 “密文”是其他的编码格式 如gbk
utf-8
latin-1
等等.encode([目标编码格式])
对象必须为unicode
类型.decode([源编码格式])
对象为str
类型\x67\x4e
\u674e
李
0x674E
0x0000674E
\xe6\x9d\x8e
\xe6\x9d\x8e
%E6%9D%8E
\346\235\216
\xc0\xee
gb2312
gbk
gb18030
\xc0\xee
SyntaxError: Non-ASCII character '\xe6' in file... , but no encoding declared;
sys.getdefaultencoding()
亦可得知
>>> sys.getdefaultencoding()
'ascii'
<encoding>
<encoding>
为utf-8
UnicodeEncodeError
错误
>>> print str_u.encode('ascii') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128).encode('gbk')
utf-8
这样Sublime Text打开后不需要ConvertToUTF8
NavigableString
NavigableString
底层类型为unicode
.replace()
方法后可转换为unicode
类型