史上最简单的 MySQL 教程(十一)「列类型 之 字符串型」

温馨提示:本系列博文已经同步到 GitHub,地址为「mysql-tutorial」,欢迎感兴趣的童鞋StarFork,纠错。

列类型(数据类型)

所谓的列类型,其实就是指数据类型,即对数据进行统一的分类,从系统的角度出发是为了能够使用统一的方式进行管理,更好的利用有限的空间。

在 SQL 中,将数据类型分成了三大类,分别为:数值型、字符串型和日期时间型。

1

字符串型

在 SQL 中,将字符串类型分成了 6 类,分别为:charvarchartextblobenumset.

第 1 类:定长字符串

定长字符串:char,即磁盘(二维表)在定义结构的时候就已经确定了最终数据的存储长度。

  • char(L):L 表示 Length,即可以存储的长度,单位为字符,最大长度为 255;
  • char(4):表示在 UTF8 环境下,需要 4*3=12 个字节。

第 2 类:变长字符串

变长字符串:varchar,即在分配存储空间的时候,按照最大的空间分配,但是实际用了多少,则是根据具体的数据来确定。

  • varchar(L):L 表示 Length,理论长度是 65536,但是会多出 1 到 2 个字节来确定存储的实际长度;
  • varchar(10):例如存储 10 个汉字,在 UTF8 环境下,需要 10*3+1=31 个字节。

实际上,如果存储长度超过 255 个字符,则既不用定长字符串也不用变长字符串,而是用文本字符串text.

如何选择定长字符串或者是变长字符串呢?

  • 定长字符串对磁盘空间比较浪费,但是效率高:如果数据基本上确定长度都一样,就使用定长字符串,例如身份证、电话号码等;
  • 变长字符串对磁盘空间比较节省,但是效率低:如果数据不能确定长度(不同的数据有变化),就使用变长字符串,例如地址、姓名等。

第 3 类:文本字符串

如果数据量非常大,通常说超过 255 个字符就会使用文本字符串。

文本字符串根据存储的格式进行分类,可以分为:

  • text:存储文字;
  • blob:存储二进制数据(其实际上都是存储路径),通常不用。

第 4 类:枚举字符串

枚举字符串:enum,需要事先将所有可能出现的结果都设计好,实际上存储的数据必须是规定好的数据中的一个。

枚举字符串的使用方式:

  • 定义:enum('元素1','元素2','元素3'...),例如enum('男','女','保密')
  • 使用:存储的数据,只能是事先定义好的数据。

执行如下 SQL 语句创建枚举表,进行测试:

-- 创建枚举表
create table my_enum(
	gender enum('男','女','保密')
)charset utf8;
2

再执行如下 SQL 语句,向表my_enum中插入测试数据:

-- 插入测试数据
insert into my_enum values ('男'),('女'),('保密');
insert into my_enum values ('male');
3

通过上面的测试,咱们可以发现使用枚举字符串有一个好处,那就是:规范数据格式,插入表中的数据只能是事先定义好的某个数据。

此外,枚举字符串还有一个作用,那就是:节省存储空间(枚举数据通常都有一个别名),枚举实际上存储的是数值而不是字符串本身。

在 MySQL 中,系统是有自动转换数据格式的功能的。在这里,咱们可以证明枚举字段存储的是数值,具体方法为:将数据取出来+0,如果是字符串最终结果永远为0,否则就是其他值。

-- 验证枚举字段实际存储的格式
select gender + 0,gender from my_enum;
4

观察上述结果,咱们可以找出枚举元素的实际规律,即按照元素出现的顺序,从1开始编号。接下来,咱们再来了解枚举的原理

  • 枚举在进行数据规范(定义)的时候,系统会自动建立一个数字与枚举元素的对应关系(放在日志中);在进行数据插入的时候,系统自动将字符串转换为对应的数值进行存储;在进行数据提取的时候,系统自动将数值转换成对应的字符串进行显示。

通过阅读以上枚举的原理,咱们可以知道:使用枚举的效率并不高(低于其他类型的数据),但能规范数据和节省存储空间。

第 5 类:集合字符串

集合字符串:set,跟枚举类似,实际存储的是数值而不是字符串。

集合字符串的使用方式:

  • 定义:set,元素列表;
  • 使用:可以使用元素列表中的多个元素,用逗号分隔。

执行如下 SQL 语句创建枚举表,进行测试:

-- 创建集合表
create table my_set(
	hobby set('音乐','电影','旅行','美食','摄影','运动','宠物')
)charset utf8;
5

再执行如下 SQL 语句,向表my_set中插入测试数据:

-- 插入测试数据
insert into my_set values ('电影,美食,宠物');
insert into my_set values (3);
6

再执行如下 SQL 语句,查看表my_set中的数据:

-- 查看数据
select hobby + 0,hobby from my_set;
7

观察上面的结果,相信大部分童鞋也懵啦!对于3还好理解,3=2+1,对应于集合中数据的编号,也正是音乐电影;但是74是什么鬼啊?在此,咱们不妨将集合('音乐','电影','旅行','美食','摄影','运动','宠物')中的元素选中的记为1,没有选中的记为0,表示成二进制,也就是:

  • 0101001

再将上面的二进制反过来:

  • 1001010

不妨算算,上述二进制对应的十进制数,即为74.

到这里,相信大家已经恍然大悟啦,原来:集合字符串中每一个元素都对应一个二进制位,其中被选中的为1,未选中的为0,最后在反过来,这个二进制数对应的十进制数即为其数据库中实际存储的是数值。

此外,集合字符串中插入元素的顺序并没有影响,最终系统都会自动去匹配集合的顺序,即:

-- 插入测试数据
insert into my_set values ('电影,美食,旅行');
insert into my_set values ('旅行,电影,美食');

上述两个 SQL 语句会产生相同的结果:

8

如上图所示,显然咱们的结论得到了验证。

最后,集合的原理同枚举类似,因此可以的到相同的结论,即:使用集合的效率并不高(低于其他类型的数据),但能规范数据和节省存储空间。


———— ☆☆☆ —— 返回 -> 史上最简单的 MySQL 教程 <- 目录 —— ☆☆☆ ————

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏HappenLee的技术杂谈

C++雾中风景番外篇:理解C++的复杂声明与声明解析

在编写C/C++代码时偶尔能看到如下的复杂声明:float(*(*e[10])(int*))[5]。我想你的第一反应一定是:MMP。虽然我们在实际工作之中是很少...

832
来自专栏python3

python3--归一化设计,接口类和抽象类,接口隔离原则,多态

2 声明某个子类兼容于某基类,定义一个接口类Interface,接口类中定义了一些接口名(就是函数名)且并未实现接口的功能,子类继承接口类,并且实现接口中的功能

1271
来自专栏Albert陈凯

Scala 特性

面向对象特性 Scala是一种纯面向对象的语言,每个值都是对象。对象的数据类型以及行为由类和特质描述。 类抽象机制的扩展有两种途径:一种途径是子类继承,另一...

2657
来自专栏软件开发 -- 分享 互助 成长

函数指针

前言: 先看两个基础,函数指针和extern关键字,然后由一个具体的例子,具体使用下函数指针。 一、基础 函数指针:即指向函数的指针,本质还是一个指针。 函数指...

1866
来自专栏Java技术分享圈

杨老师课堂_Java教程第五篇之函数运用

今天主要是讲解以下知识点: 1、方法基础知识 2、方法高级内容 3、方法案例

872
来自专栏猿人谷

总结---5

1.语义搜索 所谓语义搜索,是指搜索引擎的工作不再拘泥于用户所输入的关键字,而是准确捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,微软、谷歌和Fac...

19510
来自专栏java学习

Java每日一练(2017/7/16)

最新通知 ●回复"每日一练"获取以前的题目! ●【新】Ajax知识点视频更新了!(回复【学习视频】获取下载链接) ●答案公布时间:为每期发布题目的第二天 ★【新...

2917
来自专栏数据结构与算法

P2617 Dynamic Ranking

题目描述 给定一个含有n个数的序列a[1],a[2],a[3]……a[n],程序必须回答这样的询问:对于给定的i,j,k,在a[i],a[i+1],a[i+2]...

35214
来自专栏Aloys的开发之路

不引入新的数组,实现数组元素交换位置函数

         最近遇到一道C++的面试题,要求不引入新的数组,实现数组元素交换位置函数,看似挺简单的,却还是花费了我不少时间,这里记录下来,给大家一个简单的...

2958
来自专栏web前端

JavaScript之对数组中元素进行增删改

JavaScript中数据类型无非是:简单类型+复杂类型,什么是简单什么又是复杂。从电脑物理存储上讲,简单就是所见即所得,你看见什么,电脑里面存的就只是什么,并...

18710

扫码关注云+社区