前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >插入时,究竟发生了什么?(非开车,纯技术交流)

插入时,究竟发生了什么?(非开车,纯技术交流)

作者头像
架构师之路
发布2022-06-06 17:46:06
3500
发布2022-06-06 17:46:06
举报
文章被收录于专栏:架构师之路架构师之路

MySQL自增ID,居然大部分人都搞错了?》中的作业题,有少量答对的人,但原理讲得不透,今天简单说下作业题中的答案,以及相关知识点。

作业题是这样的:

drop table t1; create table t1(     id int not null auto_increment,     name varchar(10) unique,     count int default 0,     primary key(id),     index(name) )engine=innodb; insert into t1(id, name) values(1, "shenjian"); insert into t1(id, name) values 

(111, "111"),(NULL, "abc"),(222, "222"),(NULL,"xyz");

执行结束后id分别是:

(1, 'shenjian')

(111, '111')    // 允许指定值

(112, 'abc')    // 忽略NULL,从最大值开始增

(222, '222')    // 允许指定值

(223, 'xyz')    // 忽略NULL,从最大值开始增

如果继续执行以下语句:

insert into t1(name)values("shenjian"),("aaa"),("bbb")

on duplicate key update count=100;

请问:

(1)会不会执行报错?

(2)如果报错,为什么呢?

(3)如果不报错,得到的数据是什么呢?

知其然,知其所以然。先系统性讲讲相关知识点,InnoDB自增键,插入,如何插入,以及插入之后发生了什么?

画外音:本文均以MySQL5.6,InnoDB引擎为例。

什么是插入?

MySQL有一系列的语句,可以往数据库新增数据,称作泛插入语句(insert-like statement)。不同的插入方式,对自增键的影响是不一样的。

画外音:自增键,是指auto_increment,大家应该都用得很多。

有几种插入方式?

更为细化后,总的来说,插入方式分为三类:

(1)简单插入(simple insert)

(2)批量插入(bulk insert)

(3)混合插入(mixed-mode insert)

什么是简单插入(simple insert)?

普通的insert/replace语句,不管是单条插入还是多条插入,都是简单插入。

画外音:

(1)不包含递归的子查询;

(2)不包含insert … on duplicate key update… ;

例如,对于作业题中的数据表:

insert into t1(id, name) values(1,"shenjian");

insert into t1(name) values("zhangsan"),("lisi"),("ww");

都是简单插入。

简单插入的特点是,能够提前知道被插入的行数。因此,这类插入,在处理自增键时,是最容易的。

画外音:很容易保证自增键连续性。

什么是批量插入(bulk insert)?

与简单插入相对,在插入时,不知道被插入的行数,是批量插入。

例如,对于作业题中的数据表:

insert into t1(name) select name from t2;

除此之外,像:

(1)replace … select …

(2)load data

都是批量插入。

由于不能够提前知道多少行插入,在处理自增列时,每插入一行,才会赋值新的自增值。

画外音,官网原文是:

InnoDB assigns new values for the AUTO_INCREMENT column one at a time as each row is processed.

这里的潜台词是,在批量插入事务并发时,“可能”出现同一个事务的自增键不连续。

什么是混合插入(mixed-mode insert)?

例如,对于作业题中的SQL:

insert into t1(id, name) values 

(111,"111"),(NULL, "abc"),(222,"222"),(NULL,"xyz");

有些行插入时指定了自增键,无需数据库生成;

有些行插入时未指定自增键(NULL),需要数据库生成。

画外音:具体走哪个分支,实际执行时才知道。

以及,作业题中的如下SQL:

insert into t1(name) values("shenjian"),("aaa"),("bbb")

on duplicate key update count=100;

有些行插入实际上是修改,有些行插入实际上就是插入。

画外音:具体走哪个分支,也是实际执行时才知道。

insert … on duplicate key update … 这种情况是最最复杂的,它可能导致,系统生成的自增值,在更新阶段用不上。

画外音,官网原文是:

an INSERT followed by a UPDATE, where the allocated value for the AUTO_INCREMENT column may or may not be used during the update phase.

说了这么多,对于作业题,id分别是:

(1, 'shenjian')

(111, '111')    // 允许指定值

(112, 'abc')    // 忽略NULL,从最大值开始增

(222, '222')    // 允许指定值

(223, 'xyz')    // 忽略NULL,从最大值开始增

如果继续执行以下语句,答案会是什么呢?

insert into t1(name)values("shenjian"),("aaa"),("bbb")

on duplicate key update count=100;

答案如下:

对于:

insert ("shenjian"),("aaa"),("bbb")

系统以为是批量插入,就生成了224,225,226三个连续自增键。

接下来:

on duplicate key update ...

结果有一行插入冲突,实际是更新,导致224这个自增值并没有用上,于是就出现了奇怪的“自增值不连续”的怪异现象

架构师之路-分享技术思路

相关文章

架构师之路,21年干货精选

插入时,发生了什么,搞透了吗?谢转。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-06-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 架构师之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档