张申傲
编解码相关
关注作者
前往小程序,Get
更优
阅读体验!
立即前往
腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
张申傲
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
社区首页
>
专栏
>
编解码相关
编解码相关
张申傲
关注
发布于 2020-09-03 15:31:26
797
0
发布于 2020-09-03 15:31:26
举报
文章被收录于专栏:
漫漫架构路
编解码总结
一. 编解码
Charset类
编解码
编码:字符—>字节
解码:字节—>字符
每个文件存储在磁盘上,都会指定一种编码格式。
常用编码方式
ascii:使用7bit表示一个字符,共计可以表示128个字符。
iso-8859-1:使用8bit(1个byte)表示一个字符,共计可以表示256个字符。
ISO-8859-1向下完全兼容ASCII
,是在ASCII基础上的一个扩展,即ISO-8859-1的第0~127个字符与ASCII完全相同。
ISO-8859-1充分利用了一个字节,不会出现位的丢失。
gb2312:对所有的汉字进行了编码,每个汉字都有一个对应的表示。GB2312使用2byte表示一个汉字。
gbk:对GB2312的扩展,加入了一些汉字的生僻字。GBK完全兼容GB2312。
gb18030:最完整的汉字字符集(简体中文)。
big5:繁体中文的编码格式。
unicode:使用2字节表示一个字符,是全世界范围内最完整的字符集,包含了所有国家的字符编码。unicode采用了固定的2个字节,这对于大部分欧美国家来说,原本只需要1个字节表示的字符也要占2个字节的空间,这在很大程度上的空间浪费,
并不适合用来存储
。
utf:Unicode Translation Format,
本质上来讲是一种存储方式
,而前面介绍的都是编码方式。
utf是unicode的实现方式
。
utf-8:**变长的字节表示形式:**使用1个字节表示英文,跟ascii完全相同;使用3个字节表示中文;最多使用6个字节表示一个字符。
LE VS BE
LE:Little Endian,小端,OXFFFE
BE:Big Endian,大端,OXFEFF
BOM:Byte Order Mark,字节序标记,
本文参与
腾讯云自媒体同步曝光计划
,分享自作者个人站点/博客。
原始发表:2019/01/24 ,如有侵权请联系
cloudcommunity@tencent.com
删除
前往查看
unicode
ascii
本文分享自
作者个人站点/博客
前往查看
如有侵权,请联系
cloudcommunity@tencent.com
删除。
本文参与
腾讯云自媒体同步曝光计划
,欢迎热爱写作的你一起参与!
unicode
ascii
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
LV.
文章
0
获赞
0
目录
编解码总结
一. 编解码
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
产品介绍
产品文档
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐