前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >字符,字符串,字符编码的区别

字符,字符串,字符编码的区别

作者头像
袁新栋-jeff.yuan
发布2020-08-26 09:56:51
1.1K0
发布2020-08-26 09:56:51
举报

字符,字符串,字符编码

概念

  1. 字符是一个信息单位,在计算机里面,一个中文汉字是一个字符,一个英文字母是一个字符,一个阿拉伯数字是一个字符,一个标点符号也是一个字符。
  2. 字符集是字符组成的集合,通常以二维表的形式存在,二维表的内容和大小是由使用者的语言而定,是英语,是汉语,还是阿拉伯语。
  3. 字符编码是把字符集中的字符编码为特定的二进制数,以便在计算机中存储。编码方式一般就是对二维表的横纵坐标进行变换的算法。一般都比较简单,直接把横纵坐标拼一起就完事了。后来随着字符集的不断扩大,为了节省存储空间,才出现了各种各样的算法。

字符集和字符编码一般都是成对出现的,如ASCII、IOS-8859-1、GB2312、GBK,都是即表示了字符集又表示了对应的字符编码,以后统称为编码。

一个字符有多少个字节

  • GBK编码,一个汉字占两个字节。
  • UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16)。
  • UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。

小提示:mysql varchar(20)5.0版本后这个20代表的是20个字符。5.0版本之前是20个字节

参考资料

https://www.jianshu.com/p/bd7a6c508c33 https://zh.wikipedia.org/wiki/UTF-8 https://www.zhihu.com/question/20451870

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-08-12 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 字符,字符串,字符编码
    • 概念
      • 一个字符有多少个字节
      • 小提示:mysql varchar(20)5.0版本后这个20代表的是20个字符。5.0版本之前是20个字节
        • 参考资料
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档