专栏首页赵俊的Java专栏MySQL InnoDB 事务隔离级别的实现原理

MySQL InnoDB 事务隔离级别的实现原理

今天介绍下,在 MySQLInnoDB 存储引擎中,事务隔离是如何实现的。

InnoDB 里面每个事务有一个唯一的事务 ID,叫作 transaction id。它是在事务开始的时候向 InnoDB 的事务系统申请的,是按申请顺序严格递增的。

对于数据库的每行记录,都会有三个隐藏字段:db_trx_id (事务 id)db_roll_pt (回滚指针)delete_flag(删除标记)。— 有懂的朋友,还望别细纠,其实 delete_flag 是在头信息中,这里是为了方便理解

对于 DML 操作来说:

  • INSERT:创建一条数据,db_trx_id 的值为当前事务 id, db_roll_ptnull
  • UPDATE:复制一行数据,将当前复制后这一行的 db_trx_id 置为当前事务的 iddb_roll_pt 是一个指针,指向复制前的那一条的。
  • DELETE:复制一行数据,将当前复制后这一行的 db_trx_id 置为当前事务的 iddb_roll_pt 是一个指针,指向复制前的那一条的。并把 delete_flag 置为 true

我们会用此语句建表及初始化数据,用于下面举例:

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `k` varchar(32) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

insert into t(id, k) values(1, 1);

数据初始状态为:

Repeatable Read 可重复读

如当前的隔离界别为 Repeatable Read ,下面是 SQL 的执行过程:

那么对于第 8,10,12,13 行来说,查询的结果应该是什么呢?

结果应该分别是:2,1,3,1 。

下面我们来逐步回放,MySQL 底层是如何实现这整个过程的:

  • 第 1 行:表示每个事务的 ID 号,其中 read view 取的是所有当前活跃的事务 ID 数组,活跃指的是,已开启并生成事务 ID 但未提交的事务。max id 取的是,目前为止,最大的事务 ID,不论是否已提交。我们还称 read view 数组中,最小的值为 min id
  • 第 2 - 4 行:表示分别开启使用,并创建此事务的 read viewmax id,要注意的是,这里我并没有使用 begin/start transaction 来开启事务,是因为它们并不会马上创建 read viewmax id,而是在执行第一条 select 语句后,来进行创建的。
  • 第 5 行为修改 k 的值,自增 1,按照上面所说的规则,修改后:
  • 第 6 行,提交 ID 为 102 的事务。
  • 第 7 行执行了一个简单查询,未手动开启事务,但也会自动开启并生成 read viewmax id,分别为 read-view: [100, 101]max-id: 103

此时会根据查询规则,进行查找,规则如下:

  1. 如果数据的 db_trx_id < min id ,则说明数据在开启当前事务前已提交的,内容可见。
  2. 如果数据的 db_trx_id > max id ,则说明数据在此事务启动后生成的,内容不可见。
  3. 如果数据的 min id <= db_trx_id <= max id ,则还分为两种情况: 3.1 若 db_trx_idread view 的数组中,表示这个版本是由还没提交的事务生成的,不可见,但如果是自己的事务,则可见。 3.2. 若不在数据中,则表示这个版本是已经提交了的事务生成的,可见。

示意图如下:

当前的事务的一致性视图为 read view: [100, 101]max id: 103,那么根据这个规则,在上面的数据链中查询数据,从最新的蓝色,开始找,找到第一个数据的 db_trx_id 为 102,符合规则 3.2 属于可见范围,查询结果为 2。

  • 第 8 行,当前的事务的一致性视图为 read view: [100, 101]max id: 101同样根据规则,第一个数据的 db_trx_id 为 102,符合规则 2,不可见,那么根据指针 db_roll_pt 继续查找,找到 db_trx_id 为 10 的数据,符合规则 1,数据可见,查询结果为 1。
  • 第 9 行,修改 k 的值,自增 1,按照上面所说的规则,修改后:
  • 第 10 行,当前的事务的一致性视图为 read view: [100]max id: 100 同样根据规则,第一个数据的 db_trx_id 为 100,符合规则 3.1,在 read view 数组中,但是此 id 为当前事务 id,所以可是可见的,查询结果为 3。
  • 第 11 行,当前的事务的一致性视图为 read view: [100, 101]max id: 101 同样根据规则,第一个数据的 db_trx_id 为 100,符合规则 3.1,在 read view 中,但是此 id 不为当前事务 id,所以内容可见的,那么根据指针 db_roll_pt 继续查找,找到 db_trx_id 为 102 的数据,符合规则 2,不可见,继续根据指针 db_roll_pt 查找,找到 db_trx_id 为 10 的数据,符合规则 1,数据可见,查询结果为 1。
  • 第 12 - 13 行,为提交事务语句。

Read Committed 读已提交

处于 Read Committed 读已提交 也可套用上面的规则,不过一致性视图: read viewmax id 的创建时机,是每一条 select 语句时重新生成。你根据上面的内容,可以自己动手试验下读已提交。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 最大子数组

    一份执着✘
  • 手撸 Java Web RBAC 权限管理

    权限管理是在项目中经常要使用到的模块,有着极其重要的功能。 在 Java 帝国中有两个比较出名的权限框架,分别为 Shiro 和 Spring Security...

    一份执着✘
  • LeetCode 654 Maximum Binary Tree

    一份执着✘
  • ResultMap与ResultType的区别

    那么什么样的数据才叫单个集合,什么样的数据才叫多重集合呢?我们通过下面两张图,大家就能理解了:

    萌萌哒的瓤瓤
  • 面试题|无索引如何删除亿级数据?

    存在索引的情况下就比较简单,直接利用索引进行删除,写一个for 循环语句 每次删除500行,每次判断delete 影响的行数可以累加计算删除了多少行,直到删除结...

    田帅萌
  • 评论功能的简单实现

    网上看到有三种类型的评论,按照笔者的理解记下了过程(可能理解错了,望大神指出),所以列出的是笔者的理解,下面以模拟博客评论的场景来说明,(这些类型是笔者形容的,...

    晚上没宵夜
  • WAF安全拦截绕过思路和手法

    注意:本文分享给安全从业人员,网站开发人员和运维人员在日常工作中使用和防范恶意攻击,请勿恶意使用下面描述技术进行非法操作。

    WeiyiGeek
  • Cloudera 运营数据库提供事务支持

    我们很高兴与大家分享在向Cloudera的Operational Database添加ANSI SQL、二级索引、星型模式和视图功能之后,我们将在接下来的几个月...

    大数据杂货铺
  • 详细分析Python可变对象和不可变对象

    在 Python 中一切都可以看作为对象。每个对象都有各自的 id, type 和 value。

    砸漏
  • 约束

    一 介绍 约束条件与数据类型的宽度一样,都是可选参数 作用:用于保证数据的完整性和一致性 主要分为: PRIMARY KEY (PK) 标识该字段为该表的...

    用户1214487

扫码关注云+社区

领取腾讯云代金券