隔离级别、SI 和 SSIACID隔离级别Snapshot IsolationSerializable Snapshot Isolation

本文是我对最近读的几篇论文的总结,没有太多引用原文,纯靠自己的理解和印象串联起来。主要是为日后深入了解相关知识做个简单“索引”。

本文描述得不是很严谨,也不保证完全正确,建议有兴趣的同学去阅读论文——根据论文名称搜索就可以找到。

ACID

事务是关系数据库操作的逻辑单位。 事务的存在,是为从数据库层面保证数据的安全性,减轻应用程序的负担

说起“事务”,总会先想起 “ACID” 四个字母。

  • A:Atomicity,原子性。
  • C:Consistency,一致性。
  • I:Isolation,隔离性。
  • D:Durability,持久性。

原子性、一致性和持久性都比较好理解。

一个事务可能包含一个或多个操作,原子性保证这些操作要么全部被生效,要么全部不被生效。 数据库的一致性是指数据库中的数据都满足“完整性约束”,如主键的唯一约束。

事务提交后,要永久保存到数据库中,这就是持久性。简单地说就是数据要落盘。为了提高系统的可用性,数据还应该通过某种算法复制到其它机器。

隔离性是这几个特性里面比较不好理解的。单个事务的场景下,谈隔离性是没意义的——事务之间有并发才有隔离的必要。简单地说,隔离性指的就是数据库在并发事务下的表现。权衡安全和性能,数据库一般会有多个隔离级别。

隔离级别

SQL 标准里定义了四个隔离级别:

  • 读未提交(Read Uncommitted):会出现脏读(Dirty Read)—— 一个事务会读到另一个事务的中间状态。
  • 读已提交(Read Committed):会出现不可重复读(Unrepeatable Read) —— 事务只会读到已提交的数据,但是一行数据读取两遍得到不同的结果。
  • 可重复读(Repeatable Read):会出现幻读(Phantom Read) —— 一个事务执行两个相同的查询语句,得到的是两个不同的结果集(数量不同)。
  • 可串行化(Serializable):可以找到一个事务串行执行的序列,其结果与事务并发执行的结果是一样的。

SQL 标准定义的的这四个隔离级别,只适用于基于锁的事务并发控制。后来有人写了一篇论文 A Critique of ANSI SQL Isolation Levels 来批判 SQL 标准对隔离级别的定义,并在论文里提到了一种新的隔离级别 —— 快照隔离(Snapshot Isolation,简称 SI)。

Snapshot Isolation

在 Snapshot Isolation 下,不会出现脏读、不可重复度和幻读三种读异常。并且读操作不会被阻塞,对于读多写少的应用 Snapshot Isolation 是非常好的选择。并且,在很多应用场景下,Snapshot Isolation 下的并发事务并不会导致数据异常。所以,主流数据库都实现了 Snapshot Isolation,比如 Oracle、SQL Server、PostgreSQL、TiDB、CockroachDB(关于 MySQL 的隔离级别,可以参考这篇文章)。

虽然大部分应用场景下,Snapshot Isolation 可以很好地运行,但是 Snapshot Isolation 依然没有达到可串行化的隔离级别,因为它会出现写偏序(write skew)。Write skew 本质上是并发事务之间出现了读写冲突(读写冲突不一定会导致 write skew,但是发生 write skew 时肯定有读写冲突),但是 Snapshot Isolation 在事务提交时只检查了写写冲突。

为了避免 write skew,应用程序必须根据具体的情况去做适配,比如使用SELECT ... FOR UPDATE,或者在应用层引入写写冲突。这样做相当于把数据库事务的一份工作扔给了应用层。

Serializable Snapshot Isolation

后来,又有人提出了基于 Snapshot Isolation 的可串行化 —— Serializable Snapshot Isolation,简称 SSI(PostgreSQL 和 CockroachDB 已经支持 SSI)。

为了分析 Snapshot Isolation 下的事务调度可串行化问题,有论文提出了一种叫做 Dependency Serialization Graph (DSG) 的方法(可以参考下面提到的论文,没有深究原始出处)。通过分析事务之间的 rw、wr、ww 依赖关系,可以形成一个有向图。如果图中无环,说明这种情况下的事务调度顺序是可串行化的。这个算法理论上很完美,但是有一个很致命的缺点,就是复杂度比较高,难以用于工业生产环境。

Weak Consistency: A Generalized Theory and Optimistic Implementations for Distributed Transactions 证明在 Snapshot Isolation 下, DSG 形成的环肯定有两条 rw-dependency 的边。

Making snapshot isolation serializable 再进一步证明,这两条 rw-dependency 的边是“连续”的(一进一出)。

后来,Serializable Isolation for snapshot database 在 Berkeley DB 的 Snapshot Isolation 之上,增加对事务 rw-dependency 的检测,当发现有两条“连续”的 rw-dependency 时,终止其中一个事务,以此避免出现不可串行化的可能。但是这个算法会有误判——不可以串行化的事务调用会出现两条“连续”的 rw-dependency 的边,但是出现两条“连续”的 rw-dependency 不一定会导致不可串行化。

Serializable Snapshot Isolation in PostgreSQL 描述了上述算法在 PostgreSQL 中的实现。

上面提到的 Berkeley DB 和 PostgreSQL 的 SSI 实现都是单机的存储。A Critique of Snapshot Isolation 描述了如何在分布式存储系统上实现 SSI,基本思想就是通过一个中心化的控制节点,对所有 rw-dependency 进行检查,有兴趣的可以参考论文。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏乐沙弥的世界

Oracle 阻塞(blocking blocked)

   阻塞是DBA经常碰到的情形,尤其是不良的应用程序设计的阻塞将导致性能严重下降直至数据库崩溃。对DBA而言,有必要知道如何定位到当前系统有哪些阻塞,到底谁是...

752
来自专栏沃趣科技

数据库对象事件与属性统计 | performance_schema全方位介绍

上一篇《事件统计 | performance_schema全方位介绍》详细介绍了performance_schema的事件统计表,但这些统计数据粒度太粗,仅仅按...

2784
来自专栏我的博客

Sqlite使用说明

安装apt-get install slqite .databases List names and files of attached databases(列...

3314
来自专栏MYSQL轻松学

MySQL中,一条语句是否会被binlog记录以及以什么样的模式记录

Binlog官方 In MySQL 5.6, whether a statement is to be logged and thelogging mode t...

3029
来自专栏撸码那些事

【眼见为实】自己动手实践理解数据库READ UNCOMMITED && SERIALIZABLE

1455
来自专栏乐沙弥的世界

Oracle 实例恢复

Oracle实例失败多为实例非一致性关闭所致,通常称为崩溃(crash)。实例失败的结果等同于shutdown abort。

1035
来自专栏杨建荣的学习笔记

关于查看dba_data_files的一个小问题(r7笔记第72天)

今天帮一个朋友看一个pl/sql的问题,他已经钻到一个死胡同里列,可能明眼人一看就知道哪里有问题,但是当局者迷,所以我抽空看了一下这个pl/sql块。 pl/s...

3725
来自专栏乐沙弥的世界

db_block_checking与db_block_checksum

    db_block_checking与db_block_checksum两个参数都是对block进行检查,然而两者很容易混淆。事实上,两个参数中前者是对块...

833
来自专栏沃趣科技

Log Miner 挖挖挖

Log Miner是Oracle自Oracle 8i以后推出的一个可以分析数据库redo log和archivelog内容的工具,可以通过日志分析所有对数据库的...

1145
来自专栏蓝天

mysql_init调用卡住原因分析

看似简单的代码,但非常不幸,程序运行时,卡在了mysql_init处。语法上看不出任何破绽,原因会是什么了?

982

扫码关注云+社区