#字符import unicodeatalookup()——接受不区分大小写的标准名称,返回一个 Unicode 字符name()——接受一个 Unicode 字符,返回大写形式的名称unicodeata.name('A')snowman.encode('utf-8') #指定字符编码#验证ASCIIdef unicode_test(value):import unicodedata name = unicodedata.name(value) value2 = unicodedata.lookup(name)print('value="%s", name="%s", value2="%s"' % (value, name, value2))unicode_test('A')unicode_test('\u2603') #雪人unicodedata.name('\u00e9') #用编码值查询字符名称unicodedata.lookup('LATIN SMALL LETTER E WITH ACUTE') #根据字符查询编码值,要去掉逗号,后变前但当需要与外界进行数据交互时则1.将字符串编码为字节2.将字节解码为字符串
#变成utf-8编码方式name.encode('utf-8')name.encode('utf-8','ignore') #去掉无法解析的字符replace #无法解析的换成?backslashreplace #创建一个和 unicode-escape 类似的 Unicode 字符串xmlcharrefreplace #于创建网页中使用的字符实体串#编码和解码place = 'caf\u00e9'type(place)place_bytes = place.encode('utf-8') #以格式编码type(place_bytes)place2 = place_bytes.decode('utf-8') #转换为unicode字符原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。