前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >编解码相关

编解码相关

作者头像
张申傲
发布2020-09-03 15:31:26
7970
发布2020-09-03 15:31:26
举报
文章被收录于专栏:漫漫架构路

编解码总结

一. 编解码

  1. Charset类
  2. 编解码
    1. 编码:字符—>字节
    2. 解码:字节—>字符
  3. 每个文件存储在磁盘上,都会指定一种编码格式。
  4. 常用编码方式
    1. ascii:使用7bit表示一个字符,共计可以表示128个字符。
    2. iso-8859-1:使用8bit(1个byte)表示一个字符,共计可以表示256个字符。ISO-8859-1向下完全兼容ASCII,是在ASCII基础上的一个扩展,即ISO-8859-1的第0~127个字符与ASCII完全相同。ISO-8859-1充分利用了一个字节,不会出现位的丢失。
    3. gb2312:对所有的汉字进行了编码,每个汉字都有一个对应的表示。GB2312使用2byte表示一个汉字。
    4. gbk:对GB2312的扩展,加入了一些汉字的生僻字。GBK完全兼容GB2312。
    5. gb18030:最完整的汉字字符集(简体中文)。
    6. big5:繁体中文的编码格式。
    7. unicode:使用2字节表示一个字符,是全世界范围内最完整的字符集,包含了所有国家的字符编码。unicode采用了固定的2个字节,这对于大部分欧美国家来说,原本只需要1个字节表示的字符也要占2个字节的空间,这在很大程度上的空间浪费,并不适合用来存储
    8. utf:Unicode Translation Format,本质上来讲是一种存储方式,而前面介绍的都是编码方式。utf是unicode的实现方式
    9. utf-8:**变长的字节表示形式:**使用1个字节表示英文,跟ascii完全相同;使用3个字节表示中文;最多使用6个字节表示一个字符。
  5. LE VS BE
    1. LE:Little Endian,小端,OXFFFE
    2. BE:Big Endian,大端,OXFEFF
  6. BOM:Byte Order Mark,字节序标记,
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/01/24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 编解码总结
    • 一. 编解码
    相关产品与服务
    文件存储
    文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档