前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >汉字编码历史

汉字编码历史

作者头像
Qt君
发布2019-10-12 16:03:17
1.2K0
发布2019-10-12 16:03:17
举报

Qt君最近在处理字符乱码的问题,顺便看了下关于汉字字符编码的历史,总结分享给大家。

  早期美国计算机显示字符采用数字映射字母的方式,感觉挺好用,在60年代就做出了ASCII编码,从0-127共128个字符(包含不可见字符)。

  眼巴巴地看着美国用计算机技术助力登月,又发展民用科技。于是我们国家在80年代大力发展计算机技术,可是出现的问题是,汉字显示不了。不行,我们要和世界接轨,于是GB2312编码横空出世,囊括了六千多个常用汉字。

  随着信息化的发展,GB2312似乎也不满足日常使用了,特别是生僻字。由于汉字编码的限制身份证显示不了生僻字,需要特殊处理,有的人甚至是改名字。于是在90年代在GB2312的基础上扩展到两万多个汉字的字符编码GBK。

  不得不说中华文化博大精深,两万多个汉字似乎也是不够用,继续发展汉字编码。GB2312编码进化为GB18030编码,扩展到了七万多文字,还包含了少数民族文字。

  历史的车轮不断前进,文化相互融合与碰撞。由于各国都自制字符编码,没有统一标准,不同的系统中显示各国文字互相乱码,你眼看我眼,大家对着乱码挠头。

  不行,我们要统一起来,于是一个叫ISO的国际标准化组织制定Unicode编码。随着Unicode编码规范的建立,其实现方式有UTF-8,UTF-16,UTF-32。由于UTF-8采用变长的编码方式实现,其节省空间,兼容ASCII标准的优点, 在互联网上使用最广的一种Unicode的实现方式。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Qt君 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档