前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python字符编码(上)

Python字符编码(上)

原创
作者头像
陈不成i
修改2021-06-18 18:08:30
4130
修改2021-06-18 18:08:30
举报
文章被收录于专栏:ops技术分享ops技术分享

一.文档

  1. #字符
  2. import unicodeata
  3. lookup()——接受不区分大小写的标准名称,返回一个 Unicode 字符
  4. name()——接受一个 Unicode 字符,返回大写形式的名称
  5. unicodeata.name('A')
  6. snowman.encode('utf-8') #指定字符编码
  7. #验证ASCII
  8. def unicode_test(value):
  9. import unicodedata
  10.     name = unicodedata.name(value)
  11.     value2 = unicodedata.lookup(name)
  12. print('value="%s", name="%s", value2="%s"' % (value, name, value2))
  13. unicode_test('A')
  14. unicode_test('\u2603') #雪人
  15. unicodedata.name('\u00e9') #用编码值查询字符名称
  16. unicodedata.lookup('LATIN SMALL LETTER E WITH ACUTE') #根据字符查询编码值,要去掉逗号,后变前
  17. 但当需要与外界进行数据交互时则
  18. 1.将字符串编码为字节
  19. 2.将字节解码为字符串

二.编码方式

  1. #变成utf-8编码方式
  2. name.encode('utf-8')
  3. name.encode('utf-8','ignore') #去掉无法解析的字符
  4. replace #无法解析的换成?
  5. backslashreplace #创建一个和 unicode-escape 类似的 Unicode 字符串
  6. xmlcharrefreplace #于创建网页中使用的字符实体串
  7. #编码和解码
  8. place = 'caf\u00e9'
  9. type(place)
  10. place_bytes = place.encode('utf-8') #以格式编码
  11. type(place_bytes)
  12. place2 = place_bytes.decode('utf-8') #转换为unicode字符

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一.文档
  • 二.编码方式
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档