前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >mysql8数据类型详解

mysql8数据类型详解

作者头像
zhanyd
发布2022-05-16 13:27:22
1.9K0
发布2022-05-16 13:27:22
举报
文章被收录于专栏:编程我也会

设计mysql表结构的时候,有很多数据类型供我们选择,下面来介绍下mysql8中常用的数据类型。

整数类型

整数类型有可选的unsigned属性,表示不允许负值,这可以使正数的上限提高一倍(还多1)。

有符号和无符号类型使用相同的存储空间,并且具有相同的性能,因此可以根据实际情况选择合适的类型。

mysql可以为整数类型指定宽度,例如INT(11),对大多数应用来说这是没有意义的:它不会限制合法范围,只是规定了mysql的一些交互工具(例如mysql命令行客户端)用来显示字符的个数。

对于存储和计算来说,INT(1)和INT(20)是相同的。

实数类型

注意FLOAT和DOUBLE可表示的范围不是完全连续的浮点数,由于精度的限制,有些极小的小数是表示不了的,浮点相关的内容可以参考我的另一篇文章神奇的二进制(二)浮点数。

DECIMAL类型最多允许65个数字,表示为DECIMAL(M,D)的格式。例如DECIMAL(5,2)表示最多保存5个数字,其中2个是小数,表示的范围在-999.99 到 999.99之间。

如果小数位数D为0,则DECIMAL值不包含小数点或小数部分。

FLOAT和DOUBLE类型只能使用标准的浮点运算进行近似运算,如果需要精确运算,例如金额计算,则需要使用DECIMAL类型。

因为cpu不支持对DECIMAL的直接计算,所以在mysql5.0以上的版本中,mysql服务器自身实现了DECIMAL的高精度计算。相对而言,cpu直接支持原生的浮点计算,所以浮点计算明显更快。

涉及到金额计算,在数据量比较大的时候,可以考虑用BIGINT代替DECIMAL。例如金额单位精确到分,99.99可以用9999表示,以分为单位存储在BIGINT字段里,这样可以同时避免浮点数计算的不精确和DECIMAL精确计算代价高的问题。

字符串类型

CHAR

CHAR类型是定长的,会根据定义的长度分配空间。当存储CHAR值时,mysql会删除所有的末尾空格。

CHAR很适合存储很短的字符串,或者所有的值都接近同一个长度,例如,CHAR非常适合存储密码的MD5的值,因为这是一个定长的长度。

对于经常变动的数据,CHAR也比VARCHAR更好,因为定长的CHAR类型不容易产生碎片。

对于非常短的列,CHAR比VARCHAR在存储空间上也更有优势,例如用CHAR(1)来存储只有Y和N的值,如果采用单字节字符集只需1个字节,但是VARCHAR(1)却需要2个字节,因为还需要一个记录长度的额外字节。

VARCHAR

VARCHAR用于存储可变长的字符串,它比定长类型更节省空间。VARCHAR需要使用1或2个额外字节记录字符串的长度:如果列的最大长度小于或等于255字节,则只使用1个字节表示,如果列长度大于255字节,则需要使用2个字节表示长度。

假设采用latin字符集,一个VARCHAR(10)的列需要11个字节空间存储,一个VARCHAR(1000)的列则需要1002个字节空间存储,因为需要存储2个字节的长度信息。

哪些情况使用VARCHAR类型比较合适呢?

  • 字符串的列长度比平均长度大很多
  • 列的更新很少,碎片不是问题
  • 使用了想UTF-8这样复杂的字符集,每个字符都使用了不同的字节数进行存储
BINARY和VARBINARY

BINARY和VARBINARY它们存储的是二进制字符串。二进制字符串和常规的字符串非常相似,但是二进制字符串存储的字节码而不是字符。

填充也不一样:mysql填充BINARY采用的是 \0(零字节)而不是空格,在检索时也不会去掉填充值。

当需要存储二进制数据时,可以使用 BINARY或VARBINARY,mysql比较二进制字符串时,每次按一个字节,并且根据该字节的数值进行比较。

因此二进制比较比字符串比较简单的多,所以也更快。

BLOB和TEXT

BLOB和TEXT都是为了存储很大数据而设计的字符串数据类型,分别采用二进制和字符方式存储。

二进制类型:TINYBLOB,BLOB,MEDIUMBLOB,LONGBLOB

字符类型:TINYTEXT,TEXT,MEDIUMTEXT,LONGTEXT

与其他类型不同,mysql把每个BLOB和TEXT值当做一个独立的对象处理。存储引擎在存储是通常会做特殊处理,当BLOB和TEXT值太大时,InnoDB会使用专门的“外部”存储区域来进行存储,

此时每个值在行内需要1~4个字节存储一个指针,然后在外部存储区域存储实际值。

BLOB和TEXT家族之间仅有的不同是,BLOB存储的是二进制数据,没有排序规则和字符集;而TEXT存储的是字符,有排序规则和字符集。

mysql对BLOB和TEXT列进行排序和其他数据类型不同:它只对每个列的前max_sort_length字节而不是整个字符串做排序。

如果只需要排序前面的一小部分字符,则可以减少max_sort_length的值,或者使用ORDER BY SUBSTRING(column,length)。

mysql不能将BLOB和TEXT列全部长度的字符串进行索引,也不能使用这些索引消除排序。

日期和时间类型

DATETIME使用8个字节的存储空间,和时区无关。

TIMESTAMP使用4个字节的存储空间,显示的时间依赖时区,保存了从1970年1月1号午夜(格林尼治标准时间)以来的秒数,它和unix的时间戳相同。TIMESTAMP只能表示从1970年到2038年。

如果插入和更新数据时没有指定TIMESTAMP的值,mysql会默认的更新TIMESTAMP的值当前系统时间。

位数类型

类型

范围

BIT

1 to 64 位

BIT(1)定义一个包含1个位的数据,BIT(2)包含2个位,以此类推,最大长度为64个位。

mysql把BIT当做字符串类型,而不是数字类型。当检索BIT的值时,结果是对应二进制表示的ASCII码转换后的字符,然而在数字上下文场景中检索的时候,会使用二进制表示的数字。

例如,如果存储一个值b’00111001’(十进制的值为57)到BIT(8)的列并检索它时,得到的结果是9(9的ASCII码是57),如果对该字段进行加减,则返回结果57。

JSON类型

mysql8支持直接存储json格式字符串,对应的是json数据类型。

  • json数据列会自动验证json的数据格式,如果格式不正确会报错。
  • 最优化存储格式。json数据类型会把json格式的字符串转换成内部格式,能够快速的读取其中的元素。

对应json数据类型的操作方法有JSON_SET(), JSON_REPLACE(), JSON_REMOVE()等,详情请见官方文档https://dev.mysql.com/doc/refman/8.0/en/json.html。

小结

mysql设计表的数据类型的时候,下面几个简单的原则有助于设计出好的数据类型:

  • 更小的更好 选择你认为不会超越范围的最小类型,更小的数据类型通常更快,因为它们占用更少的磁盘、内存和cpu缓存,并且处理时需要的cpu周期更少。
  • 简单就好 简单的数据类型操作通常更快,例如整形的操作比字符串更快,因为字符串有字符集和校对规则(排序规则)比整形更复杂。
  • 尽量避免null 如果字段可以不存储null值,尽量把字段设置成not null。因为可为null的列使得索引、索引统计和值比较都更复杂,可为null的列会使用更多的存储空间,在mysql里也需要特殊处理。

参考资料: 《高性能MYSQL(第三版)》 mysql官方文档

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 编程我也会 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 整数类型
  • 实数类型
  • 字符串类型
    • CHAR
      • VARCHAR
        • BINARY和VARBINARY
          • BLOB和TEXT
          • 日期和时间类型
          • 位数类型
          • JSON类型
          • 小结
          相关产品与服务
          云数据库 SQL Server
          腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档