探究InnoDB可重复读

在RC(Read Committed)和RR(Repeatable Read)两种事务隔离级别下,InnoDB存在两种数据读取方式:

快照读(Snapshot Read)

故名思意,快照读读取的都是快照数据,快照怎么来,在InnoDB引擎下是基于undo log,那undo log又是什么?举例说明,假设有这样一个表:

-- 表结构
CREATE TABLE `innodb_test` (
    `id` INT(11) NOT NULL AUTO_INCREMENT,
    `name` VARCHAR(100) NOT NULL DEFAULT '0',
    `age` INT(11) NOT NULL DEFAULT '0',
    PRIMARY KEY (`id`),
    INDEX `idx_age` (`age`)
)
ENGINE=InnoDB;

-- 初始数据
INSERT INTO `innodb_test` (`id`, `name`, `age`) VALUES (1, '貂蝉', 100),(2, '庄周', 120),(3, '项羽', 130);
  • id=1的初始数据行
  • 事务A执行如下语句 UPDATE innodb_test SET name='嬴政', age=90 WHERE id=1; 此时innodb会做如下操作:
    1. 把该行修改前的值Copy到undo log(Copy on write);
    2. 修改当前行的值,填写事务编号,使回滚指针指向undo log中的修改前的行。
  • 事务B执行如下语句 UPDATE innodb_test SET name='甄姬', age=91 WHERE id=1; 此时undo log中有2条记录,它们通过回滚指针相连。

undo log的存在解决了两个问题,一是数据回滚,二是实现了MVCC (Multi-Version Concurrency Control) ,快照读读取的就是undo log中的数据,所以这种读取是不需要加锁的,避免了读写冲突。常见的快照读语句就是最常见的SELECT,比如:

SELECT * FROM innodb_test WHERE id=1;

快照读在RC和RR隔离级别下的表现却是不一样的,为了方便说明,现在将数据还原到初始数据,然后按照下表的顺序操作。

#

事务1

事务2

1

begin;

begin;

2

SELECT * FROM innodb_test WHERE id=1;// 输出1-貂蝉-100

3

UPDATE innodb_test SET name='嬴政', age=90 WHERE id=1;

4

commit;

5

SELECT * FROM innodb_test WHERE id=1;// 输出???

  • RC 输出的是最新提交的结果(1-嬴政-90),RC级别的快照读遵循以下规则:
    • 优先读取当前事务修改的数据,自己修改的,当然可以读到了;
    • 其次读取最新已提交数据。

    会出现前后读取结果不一样的情况,但读取的是最新数据。

  • RR 输出结果和第一次查询是一样的(1-貂蝉-100),RR级别的快照读遵循以下规则:
    • 优先读取当前事务修改的数据,和RC一样;
    • 其次读取小于当前事务id的最新一条已提交数据,此时数据版本已经确定了,后面的快照读取始终读取这个版本。

    通过这样的机制,保证了快照读的可重复读,但读取到的数据很可能已经过期了。

当前读(Current Read)

而当前读,读取的是最新已提交数据,并且都会加行锁,如下语句都会产生当前读:

SELECT balabala LOCK IN SHARE MODE;
SELECT balabala FOR UPDATE;
INSERT balabala;
UPDATE balabala;
DELETE balabala;

当前读需要保证其他并发事务不能修改当前记录,对读取记录加锁。其中,第一条语句,对读取记录加S锁(共享锁),其他的操作,都加的是X锁(排它锁)。当前读在RC和RR隔离级别下的表现也是不一样的,为了方便说明,现在将数据还原到初始数据,然后按照下表的顺序操作。

#

事务1

事务2

1

begin;

begin;

2

SELECT * FROM innodb_test WHERE age=120 FOR UPDATE;

3

insert into innodb_test(name, age) values('嬴政', 120);// 此时会发生什么?

  • RC 成功执行,但会造成事务1的幻读,前后两次读取结果不一样。
  • RR 会锁等待,在RR隔离级别下,事务1的sql不仅会对该记录加X锁,还会对上下两个数据间隙加间隙锁,以此确保在数据读取期间,其它事物不会在该间隙内增加数据,从而保证可重复读。

总结

RR隔离级别下,快照读通过undo log来保证可重复读,当前读通过X(S)锁+GAP锁来保证可重复读,但显然快照读和当前读之间无法保证可重复读。本文对可重复读的实现机制做了阐述,关于undo log、锁等知识仅仅从简描述,后面有时间再详细写一下。

版权声明 本博客所有的原创文章,作者皆保留版权。转载必须包含本声明,保持本文完整,并以超链接形式注明作者高爽。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏挖掘大数据

整合Kafka到spark-streaming实例

在这篇文章里,我们模拟了一个场景,实时分析订单数据,统计实时收益。

1.2K8
来自专栏杨建荣的学习笔记

MySQL中使用pt-osc的一些小结

Percona的pt-osc工具算是DBA的一个福利工具。想想一个数据量有些大的表,在上面做DDL操作真是一种煎熬,我们也基本理解了这是一种空间换时间的...

1081
来自专栏听Allen瞎扯淡

Fetch Size 与 JDBC 内存管理

接触到 JDBC 的 Fetch Size 这个属性缘起一个性能问题,项目中需要将一个有千万级数据量的表中的记录导出到文件中去。按照正常的路数,先初始化连接;接...

632
来自专栏扎心了老铁

spark-streaming集成Kafka处理实时数据

在这篇文章里,我们模拟了一个场景,实时分析订单数据,统计实时收益。 场景模拟 我试图覆盖工程上最为常用的一个场景: 1)首先,向Kafka里实时的写入订单数据,...

5475
来自专栏沃趣科技

MVCC原理探究及MySQL源码实现分析

目录预览 数据库多版本读场景 MVCC实现原理 1、通过DB_ROLL_PT 回溯查找数据历史版本 2、通过read view判断行...

3898
来自专栏云霄雨霁

Java--JDBC总结

1965
来自专栏性能与架构

MySQL Query Cache实现原理

MySQL的Query Cache实现原理实际上并不是特别复杂,简单来说就是将客户端请求的Query语句(仅限于SELECT类型的Query)通过一定的hash...

36311
来自专栏蓝天

Oracle 系统表大全

数据字典dict总是属于Oracle用户sys的。   1、用户:    select username from dba_users;   改口令    al...

572
来自专栏java一日一条

理解MySQL——架构与概念

写在前面:最早接触的MySQL是在三年前,那时候MySQL还是4.x版本,很多功能都不支持,比如,存储过程,视图,触发器,更别说分布式事务等复杂特性了。但从5....

402
来自专栏nummy

python中MySQLdb模块用法实例

MySQLdb提供了connect方法用来和数据库建立连接,接收数个参数,返回连接对象:

491

扫码关注云+社区