专栏首页MySQL入坑记上个厕所的功夫,搞懂MySQL事务隔离级别

上个厕所的功夫,搞懂MySQL事务隔离级别

“隔离级别” 出于MySQL四大特性(ACID)中的“I”,也就是隔离性。目的是实现数据、事务一致性“C”。 MySQL在多线程并发场景下,可能会出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)这类并发问题,为了解决这些问题,引申出“隔离级别”的概念。 谈隔离级别之前,你首先需要知道,隔离得越严实,效率就会越低。隔离就像是生活中那一件件锁事儿,枷锁越多,活得越累。在很多时候,我们都要在二者之间寻找一个平衡点。


测试数据准备

测试表是一些好朋友客串一下,请原谅我的不要脸【/偷笑】。(建表语句在文章末尾)

mysql> select * from department;
+----+-----------+-----+-----+------------+------+-----------+
| ID | NAME      | SEX | AGE | CLASS      | PAY  | HOBBY     |
+----+-----------+-----+-----+------------+------+-----------+
|  1 | 陈哈哈    | 男  |  25 | 技术1部    | 3000 | 摸鱼      |
|  2 | 扈亚鹏    | 男  |  25 | 技术1部    | 4000 | 美食      |
|  3 | 刘晓莉    | 女  |  24 | 技术1部    | 4000 | 摸鱼      |
|  5 | 徐立楠    | 女  |  24 | 技术1部    | 4000 | 阅读      |
|  6 | 顾昊      | 男  |  25 | 技术1部    | 4000 | 摸鱼      |
|  7 | 陈子凝    | 女  |  25 | 技术1部    | 5000 | 看电影    |
| 14 | 朱志鹏    | 男  |  25 | 技术1部    | 5000 | 看小说    |
| 19 | 李昂      | 男  |  27 | 技术1部    | 7000 | 看片儿    |
+----+-----------+-----+-----+------------+------+-----------+
8 rows in set (0.00 sec)

为了更好理解下文,这里先给出个业务场景:

老板:原来陈哈哈是我失散多年的大侄子!财务,给 “陈哈哈” 的工资涨 “10000” 大洋。 陈哈哈:谢谢老叔!MUA~

并发场景下事务存在的数据问题

下面我们介绍一下脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)这三类并发问题,以及每种问题出现的原理及场景。

  • 1. 脏读(针对的是未提交读数据)

事务A修改了数据,但未提交,而事务B查询了事务A修改过却没有提交的数据,这就是脏读,因为事务A可能会回滚。

场景:老板(老叔)大喊了一嗓子,但没有指定哪个财务改。财务A大姐和财务B大哥都听到了,但他俩不知道由谁来改,就分别进行了下方流程操作:

时间点

事务A(财务大姐)

事务B(财务大哥)

陈哈哈

T1

(财务大姐要给我改,查到工资:3000) Begin; SELECT PAY from department where `NAME` = '陈哈哈';

T2

UPDATE department SET ` PAY` = ` PAY` + 10000 where `NAME` = '陈哈哈';

(财务大哥看看财务大姐改没改) Begin;

T3

(财务大姐突然发现财务大哥也在给我改)

(一查发现。哦!已经改了)(工资:13000) SELECT PAY from department where `NAME` = '陈哈哈';

T4

(财务大哥就继续去摸鱼了) commit;

T5

(就把事务A回滚了) rollback;

T6

???

T7

???

就这样,因为 “脏读”就导致我每个月少1万大洋?

  • 2. 不可重复读(针对其他提交前后,读取数据本身的对比)

事务A 先 查询了工资金额,是3000块钱,未提交 。事务B在事务A查询完之后,修改了工资金额,变成了13000, 在事务A前提交了;如果此时事务A再查询一次数据,就会发现钱跟上一次查询不一致,是13000,而不是3000。这就是不可重复读。强调事务A对要操作的数据被别人修改了,但在不知请的情况下拿去做之前的用途。

场景同上:老板嗷一嗓子,但没有指定哪个财务改。财务A大姐和财务B大哥都听到了,但他俩不知道由谁来改,就分别进行了下方流程操作:

时间点

事务A(财务大姐)

事务B(财务大哥)

T1

(财务大姐要给我改,查到工资:3000) Begin; SELECT PAY from department where `NAME` = '陈哈哈';

(财务大哥也要给我改,查到工资:3000) Begin; SELECT PAY from department where `NAME` = '陈哈哈';

T2

(财务大姐喝了口水)

(财务大哥直接改了) UPDATE department SET ` PAY` = ` PAY` + 10000 where `NAME` = '陈哈哈';

T3

(大姐正想改,突发强迫症,想再查一下,查到工资:13000) SELECT PAY from department where `NAME` = '陈哈哈';

T4

(大姐:???)

(财务大哥就继续去摸鱼了) commit;

T5

(最终大姐回滚了,虽然并没有改什么,但你至少明白了什么是“强迫症”) rollback;

T6

(大姐把BUG报给了产品部)

T7

(一位35岁程序员被祭天)

对于不可重复读,说简单点就是同一个事物内,查到的结果都不一致,就失去了MySQL的“一致性”,这是很严重的错误。你想,如果财务大姐没有二次确认,而是直接以第一次查询为准,又给我加了1万怎么办?想想还有点小激动呢。

  • 3. 幻读(针对其他提交前后,读取数据条数的对比)

幻读是指在同一个事务中,存在前后两次查询同一个范围的数据,但是第二次查询却看到了第一次查询没看到的行,一般情况下只新增。

事务A先修改了某个表的所有纪录的状态字段为已处理,未提交;事务B也在此时新增了一条未处理的记录,并提交了;事务A随后查询记录,却发现有一条记录是未处理的,很是诧异,刚刚不是全部修改为已处理嘛,以为出现了幻觉,这就是幻读。

场景:老板每个月审批一次涨薪(审批表:shenpiTable),这时财务刚刚把我的工资申请提交了,老板正好在审批。一键审批通过后,突然看到了一条新的“未审批”记录(新增的),还是大侄子陈哈哈的。 老板:有幻觉?有BUG!!等等,我如果假装看不到这月是不是就省了1万块大洋? 陈哈哈:???

时间点

事务A(老板)

事务B(财务大哥)

T1

(老板审批加工资申请,并没有注意到“陈哈哈”) Begin; SELECT * from shenpiTable where Status = '未通过';

(财务大哥准备给我提交涨工资申请记录) Begin; SELECT * from shenpiTable where Status = '未通过';

T2

(老板喝了口水)

(财务大哥摸了摸鱼)

T3

(老板一键通过了,头都没抬那种~) UPDATE shenpiTable SET Status = ‘通过’ where shenpiTable = ‘未通过’;

(财务大哥摸了摸鱼)

T4

(财务大哥新增一条我的申请记录) insert into shenpiTable values(“xxx”,"陈哈哈",“未通过”);

T5

(老板又确认一下,突然发现我的审批还没通过。一脸懵逼,突然想到了什么,果断commit,笑嘻嘻的去洗脚了。) SELECT * from shenpiTable where Status = '未通过'; commit;

commit;

T6

T7

(第二天听到又有一位程序员被我打死)

  • 脏读说的是事务知道了自己本不应该知道的东西,强调的动作是查询,我看到了自己不该看的东西 ;
  • 不可重复读强调的是一个人查的时候,其他人却可以增删改, 但我却不知道数据被改了,还拿去做了之前的用途;
  • 幻读强调的是我修改了数据,等我要查的时候,却发现有我没有修改的记录,为什么,因为有其他人插了一条新的。

隔离级别概述

为了解决上述问题,MySQL制定了四种不同的“隔离级别”,包括:读未提交(read uncommitted)、读提交(read committed)、可重复读(repeatable read)和串行化(serializable )。

隔离级别

效果

读未提交(RU)

一个事务还没提交时,它做的变更就能被别的事务看到。(别的事务指同一时间进行的增删改查操作)

读提交(RC)

一个事务提交(commit)之后,它做的变更才会被其他事务看到。

可重复读(RR)

一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。

串行(xíng)化(S)

正如物理书上写的,串行是单线路,顾名思义在MySQL中同一时刻只允许单个事务执行,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行。

实例分析

(场景再现)老板:原来陈哈哈又双叒(ruò)叕(zhuó)是我失散多年的大侄子!财务,把 “陈哈哈” 的工资涨 “10000” !

以下表中的两个事务为例,看看在不同隔离级别下,分别会出现什么结果。能否避免上述问题呢?

时间点(宝强绿)

事务A

事务B

T1

Begin; SELECT PAY from department where `NAME` = '陈哈哈'; (查询工资:3000)

T2

Begin;

T3

SELECT PAY from department where `NAME` = '陈哈哈'; (查询工资:3000)

T4

UPDATE department SET ` PAY` = `PAY` + 10000 where `NAME` = '陈哈哈';

T5

SELECT PAY from department where `NAME` = '陈哈哈'; (查询工资:Res_A1)

T6

commit;

T7

SELECT PAY from department where `NAME` = '陈哈哈'; (查询工资:Res_A2)

T8

commit;

T9

SELECT PAY from department where `NAME` = '陈哈哈'; (查询工资:Res_A3)

  • 读未提交(RU):

读未提交

Res_A1

Res_A2

Res_A3

结果

13000

13000

13000

在RU隔离级别下,事务A 在T5时刻,就可以提前读到未提交的事务B 结果。

  • 读提交(RC):

读提交

Res_A1

Res_A2

Res_A3

结果

3000

13000

13000

读提交又叫读已提交,在RC隔离级别下,事务A 需要在 事务B commit提交后,才能看到事务B 修改的结果。所以在T5时刻,事务A 查到的陈哈哈的工资是 3000。

  • 可重复读(RR)

可重复读

Res_A1

Res_A2

Res_A3

结果

3000

3000

13000

可重复读是MySQL默认的隔离级别,在RR级别下,对于所有进行中(begin - commit)的事务,比如事务A,无论执行多少次SELECT(查询表 department ),只能看到的是同一张 department 表的结果视图(ReadView),该视图(ReadView)是在本事务启动(begin)时生成的,在事务A 结束(commit)后释放。该隔离级别会保证单事务内查看视图的一致性,称为“可重复读”。

  • 串行(xíng)化(S)

串行化

Res_A1

Res_A2

Res_A3

结果

3000

3000

13000

串行化隔离级别不支持并发事务,由于事务A 早于事务B,事务A执行SELECT时,就给 department 表加了锁,事务B 需要等事务A 结束后才能执行,因此T5、T7时刻是 3000,T8时刻事务A提交,事务B释放锁并执行,最后T9时刻查到我的工资是 13000。

原理描述

在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。在MySQL默认的隔离级别“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的。这里需要注意的是,“读未提交”隔离级别下直接返回记录上的最新值,没有视图概念;而“串行化”隔离级别下直接用加锁的方式来避免并行访问。

我们可以看到在不同的隔离级别下,数据库行为是有所不同的。Oracle 数据库的默认隔离级别其实就是“读提交”,因此对于一些从 Oracle 迁移到 MySQL 的应用,为保证数据库隔离级别的一致,你一定要记得将 MySQL 的隔离级别设置为“读提交”。

配置的方式是,将启动参数 transaction-isolation 的值设置成 READ-COMMITTED。你可以用 show variables 来查看当前的值。

mysql> show variables like 'transaction_isolation';
 
+-----------------------+----------------+
| Variable_name | Value |
+-----------------------+----------------+
| transaction_isolation | READ-COMMITTED |
+-----------------------+----------------+

总结来说,存在即合理,每种隔离级别都有自己的使用场景,你要根据自己的业务情况来定。我想你可能会问那什么时候需要“可重复读”的场景呢?我们来看一个数据校对逻辑的案例。

假设你在管理一个个人银行账户表。一个表存了每个月月底的余额,一个表存了账单明细。这时候你要做数据校对,也就是判断上个月的余额和当前余额的差额,是否与本月的账单明细一致。你一定希望在校对过程中,即使有用户发生了一笔新的交易,也不影响你的校对结果。

这时候使用“可重复读”隔离级别就很方便。事务启动时的视图可以认为是静态的,不受其他事务更新的影响。

四种隔离级别的问题解决情况

标题

脏读

不可重复读

幻读

读未提交(RU)

×

×

×

读提交(RC)

×

×

可重复读(RR)

串行(xíng)化(S)

测试建表语句

-- 建表语句
DROP TABLE IF EXISTS `department`;
CREATE TABLE `department` (
  `ID` int(11) NOT NULL AUTO_INCREMENT,
  `NAME` varchar(30) CHARACTER SET utf8mb4 NOT NULL,
  `SEX` char(2) NOT NULL,
  `AGE` int(11) NOT NULL,
  `CLASS` varchar(10) NOT NULL,
  `PAY` int(11) NOT NULL,
  `HOBBY` varchar(100) DEFAULT NULL,
  PRIMARY KEY (`ID`)
) ENGINE=InnoDB AUTO_INCREMENT=20 DEFAULT CHARSET=utf8;
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('1', '陈哈哈', '男', '25', '技术1部', '3000', '摸鱼');
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('2', '扈亚鹏', '男', '25', '技术1部', '4000', '美食');
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('3', '刘晓莉', '女', '24', '技术1部', '4000', '摸鱼');
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('5', '徐立楠', '女', '24', '技术1部', '4000', '阅读');
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('6', '顾昊', '男', '25', '技术1部', '4000', '摸鱼');
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('7', '陈子凝', '女', '25', '技术1部', '5000', '看电影');
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('14', '朱志鹏', '男', '25', '技术1部', '5000', '看小说');
INSERT INTO `department` (`ID`, `NAME`, `SEX`, `AGE`, `CLASS`, `PAY`, `HOBBY`) VALUES ('19', '李昂', '男', '27', '技术1部', '7000', '看片儿');

总结

以上就是对MySQL中三种并发数据问题以及四种隔离级别的介绍,有些朋友会问,那这几种隔离级别解决上述三种问题的原理是什么呢?可重复读RR是如何解决幻读问题的?

请关注后续文章《MySQL的MVCC原理及如何解决数据问题》、《灵魂拷问:InnoDB是如何解决幻读的》

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Mysql进阶垫脚石 -- Sql命令的执行状态有哪几种

    每当执行SQL运行缓慢时,我们都会使用 show processlist 查看一下mysql当前进程的执行情况;(如下)

    陈哈哈
  • Mysql进阶垫脚石 -- 到底什么是数据库事务?

    事务(Transaction)是并发控制的基本单位。所谓的事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。事务处理可以确保...

    陈哈哈
  • @有缘人,送你一套Linux搭建redis集群宝典

    5、在redis-cluster目录下新建7001 7002 7003 7004 7005 7006集群节点目录

    陈哈哈
  • 【redis】05-redis 事务(Multi、exec、watch、Discard)

    根据上面的分析,感觉这怎么和mysql中的事务不太对呢,都不能保证数据的一致性。此时我们的redis官方为了解决这个问题,所以添加了watch命令。

    envoke
  • 短时交通状态预测:准确率 VS 效率

    《Short-term traffic state prediction from latent structures: Accuracy vs. effici...

    深度学习与交通大数据
  • “鱼脸识别”助力渔业管理

    据美国政府计算机网站(GCN)报道,为了监测包括北太平洋和东白令海在内的约三百万平方英里海洋中的鱼类资源,美国阿拉斯加州渔业科学中心开始使用面部识别技术(更准确...

    人工智能快报
  • 并发编程-多线程的好处

    上一文:并发编程-并发的简史 如果线程使用得当,多线程可以降低你的开发和维护成本,而且还能改善复杂应用程序的性能。多线程让模仿人类工作方式以及交互变得简单,多线...

    ImportSource
  • 将博客主题替换成 Clean Blog

    在此之前,我们先为前端资源创建对应目录,在根目录下创建 resources 目录,然后在该目录下新建 js、sass 子目录,分别用于存放编译前的脚本、样式文件...

    学院君
  • 深度 | 张正友:计算机视觉的三生三世 | CCF-GAIR 2019

    今年是中国人工智能四十年,在这四十年间发生了很多事情,听听张正友博士讲一讲计算机视觉的前世、今生和可能的未来。

    AI科技评论
  • 51信用卡/二面/java岗

    牛客网

扫码关注云+社区

领取腾讯云代金券