距离上次更新 MySQL 从零开始系列,已经过去了十几天,时间隔得有点长,由于我选用的是 MySQL 的最新版本,网上的教程大多停留在 MySQL 5.x,所以要参阅一下官方文档,而文档是英文的,看起来比较耗时,希望大家可以理解,此系列一定会更新到底!
前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:
mysql> create table class(
-> id int primary key auto_increment,
-> name varchar(10) not null default '',
-> gender char(1) not null default '',
-> company varchar(20) not null default '',
-> salary decimal(6,2) not null default 0.00
-> )engine myisam charset utf8;
上述语句声明了字段的名称、类型、所占空间、默认值 和是否可以为空等信息。其中的 int、varchar、char 和 decimal 都是 MySQL 所支持的数据类型,本节将详细介绍 MySQL 支持的数据类型。
MySQL 中定义数据字段的类型对数据库的优化非常重要。MySQL中的每种数据类型都可以通过以下特征来确定:
MySQL 支持的数据类型可以分为 数值、日期/时间和字符串(字符)类型,另外还有空间数据类型和JSON数据类型,本节以前三种数据类型为主,最后两种简单介绍一下。
1
数值类型
MySQL支持所有标准SQL数值数据类型。
这些类型包括严格数值数据类型(INTEGER、SMALLINT、DECIMAL和NUMERIC),以及近似数值数据类型(FLOAT、REAL和DOUBLE PRECISION)。
关键字INT是INTEGER的同义词,关键字DEC是DECIMAL的同义词。
作为SQL标准的扩展,MySQL也支持整数类型TINYINT、MEDIUMINT和BIGINT。下面的表显示了需要的每个整数类型的存储和范围。
以 TINYINT 为例详细介绍整形数值型的一些属性及操作。
TINYINT[(M)][UNSIGNED][ZEROFILL]
M表示每个值的位数,此处为显示的位数,并不是占用字节大小。该可选显示宽度规定用于显示宽度小于指定的列宽度的值时从左侧填满宽度。当结合可选扩展属性ZEROFILL使用时, 默认补充的空格用零代替。例如,对于声明为INT(5) ZEROFILL的列,值5检索为00005。
注意:M 要与 ZEROFILL 配合使用才有效果。
如果一个数值列指定为 ZEROFILL, MySQL自动为该列添加 UNSIGNED 属性。
mysql> create database datatype;
Query OK, 1 row affected (0.03 sec)
mysql> use datatype;
Database changed
mysql> show tables;
Empty set (0.00 sec)
mysql> create table int_type(
-> id TINYINT not null default 0,
-> age TINYINT(4) not null default 0,
-> distance TINYINT(4) ZEROFILL not null default 0,
-> score TINYINT UNSIGNED not null default 0,
-> ranking TINYINT ZEROFILL not null default 0
-> )engine myisam charset utf8;
Query OK, 0 rows affected, 1 warning (0.06 sec)
mysql> desc int_type;
+----------+------------------------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+----------+------------------------------+------+-----+---------+-------+
| id | tinyint(4) | NO | | 0 | |
| age | tinyint(4) | NO | | 0 | |
| distance | tinyint(4) unsigned zerofill | NO | | 0000 | |
| score | tinyint(3) unsigned | NO | | 0 | |
| ranking | tinyint(3) unsigned zerofill | NO | | 000 | |
+----------+------------------------------+------+-----+---------+-------+
5 rows in set (0.00 sec)
对于浮点列类型,在MySQL中单精度值使用4个字节,双精度值使用8个字节。
DOUBLE[(M,D)][UNSIGNED][ZEROFILL]
MySQL 没有内置的 BOOLEAN 或 BOOL 数据类型,使用最小的整数类型,也就是 TINYINT(1) 来表示。
2
日期和时间类型
表示时间值的日期和时间类型为 DATETIME、DATE、TIMESTAMP、TIME 和 YEAR。
每个时间类型有一个有效值范围和一个"零"值,当指定不合法的MySQL不能表示的值时使用"零"值。
TIMESTAMP 类型有专有的自动更新特性,将在后面描述。
注意:
3
字符串类型
在MySQL中,字符串可以容纳从纯文本到二进制数据(如图像或文件)的任何内容。 字符串类型指 CHAR、VARCHAR、BINARY、VARBINARY、BLOB、TEXT、ENUM和SET。
CHAR 和 VARCHAR 类型类似,但它们保存和检索的方式不同。它们的最大长度和是否尾部空格被保留等方面也不同。在存储或检索过程中不进行大小写转换。
CHAR和VARCHAR类型声明时需要一个长度值,该值表示你想要想要存储的字符的最大数量。例如,CHAR(30)可以容纳30个字符。 CHAR 列的宽度在创建表时已经固定下来了,如果插入记录该字段的宽度不足指定宽度,那么要在右侧自动填补 空格。检索CHAR值时,除非启用 PAD_CHAR_TO_FULL_LENGTH
SQL模式,否则将删除尾部空格。
存储 VARCHAR 值时,不会填充。在与标准SQL一致的情况下,存储和检索值时保留尾部空格。
下表展示了CHAR和VARCHAR之间的差异,它展示了将各种字符串值存储到CHAR(4)和VARCHAR(4)列的结果(假设此列使用了一个单字节字符集,如latin1)。
请看下面例子:
01.vchar_varchar
BINARY 和 VARBINARY 类似于 CHAR 和 VARCHAR,不同的是它们包含二进制字符串而不要非二进制字符串。也就是说,它们包含字节字符串而不是字符字符串。这说明它们没有字符集,并且排序和比较基于列值字节的数值。
BLOB 是一个二进制大对象,可以容纳可变数量的数据。有 4 种 BLOB 类型:TINYBLOB、BLOB、MEDIUMBLOB 和 LONGBLOB。它们区别在于可容纳存储范围不同。四种 TEXT 类型是TINYTEXT、TEXT、MEDIUMTEXT 和 LONGTEXT。它们对应于四个 BLOB 类型,并且具有相同的最大长度和存储要求。
ENUM 是一个字符串对象,它从一个允许值列表中选择了一个值,这些值在表创建时显式地列出了列规范中。它有这些优势:
枚举值必须是引用的字符串文字。 你可以这样用枚举列创建表:
mysql> create table shirts (
-> name varchar(40),
-> size enum('x-small', 'small', 'medium', 'large')
-> );
Query OK, 0 rows affected (0.10 sec)
mysql> insert into shirts
-> (name, size)
-> values
-> ('dress shirt', 'large'),
-> ('t-shirt', 'medium'),
-> ('polo shirt', 'small');
Query OK, 3 rows affected (0.04 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql> select name, size from shirts where size = 'large';
+-------------+-------+
| name | size |
+-------------+-------+
| dress shirt | large |
+-------------+-------+
1 row in set (0.00 sec)
假如向该表中插入一百万条 值为 'medium'
的记录,存储空间需要一百万字节。相比而言,如果以字符串 'medium'
存储,则需要六百万字节。
SET 是一个字符串对象,可以有0个或多个值,并且每一个值都必须从表创建时指定的允许值列表中选择。SET 的列值由多个集合成员组成的,用逗号(,)分隔。这样的话,SET成员值本身不应该包含逗号。
例如,由 SET('one', 'two') NOT NULL
指定的数据列可以有这些值:
''
'one'
'two'
'one,two'
SET
列最多可以包含64个不同的成员。
看如下例子:
mysql> INSERT INTO myset (col) VALUES
-> ('a,d'), ('d,a'), ('a,d,a'), ('a,d,d'), ('d,a,d');
Query OK, 5 rows affected (0.09 sec)
Records: 5 Duplicates: 0 Warnings: 0
mysql> select col from myset;
+------+
| col |
+------+
| a,d |
| a,d |
| a,d |
| a,d |
| a,d |
+------+
5 rows in set (0.00 sec)
从查询结果可以看出:如果一条记录里已经包含 SET 的一个成员了,就不会重复保存该值。
4
空间数据类型
MySQL支持许多包含各种几何和地理值的空间数据类型,如下表所示:
5
JSON 数据类型
MySQL 支持由 RFC 7159 规定的原生 JSON
数据类型,以更有效地存储和管理JSON文档。 本机JSON数据类型提供JSON文档的自动验证和最佳存储格式。 JSON 列不能有默认值。
mysql> CREATE TABLE myjson (jdoc JSON);
Query OK, 0 rows affected (0.13 sec)
mysql> INSERT INTO myjson
-> VALUES
-> ('{"key1": "value1", "key2": "value2"}');
Query OK, 1 row affected (0.03 sec)
mysql> SELECT jdoc FROM myjson;
+--------------------------------------+
| jdoc |
+--------------------------------------+
| {"key1": "value1", "key2": "value2"} |
+--------------------------------------+
1 row in set (0.00 sec)
mysql> INSERT INTO myjson
-> VALUES
-> ('[1, 2');
ERROR 3140 (22032): Invalid JSON text: "Missing a comma or ']' after an array element." at position 5 in value for column 'myjson.jdoc'.
可以看到,如果我们插入的记录 JSON 数据格式不正确是不能成功的。