Mysql中的事务的原子性和持久性是由Redo Log实现的。 Redo Log也被称为重做日志。Redo通常用来记录物理日志。Redo Log包含两部分:
Redo Log Buffer:内存中的日志缓冲,易丢失
Redo Log File: 存放在磁盘中的重做日志,不易丢失
Redo Log四种刷盘规则:
1)通过innodb_flush_log_at_trx_commit决定,其中:
1的性能最差,即使崩溃,也不会丢失日志
0是每1s写入日志
2是每秒写入到buffer中,然后通过fsync同步
2)通过刷新日志频率:innodb_flush_log_at_timeout的值决定
3)当Log Buffer中已经使用的内存超过一半时,也会触发
4)当事务中存在checkpoint时,在一定程度上代表刷写到磁盘日志所在的LSN位置
LSN:日志的逻辑序列号,占8个字节
Mysql的一致性由undo log实现的。 undo log在Mysql事务的实现中主要作用: 回滚事务 多版本并发事务 MVCC 在Mysql启动事务之前,会先将要修改的数据存储到undo log中。如果事务发生回滚或数据库崩溃,可以利用undo log对数据库中未提交的事务进行回滚操作,从而保证数据的一致性。 undo log也会产生Redo Log。由于undolog的完整性和可靠性需要Redo Log来保证。数据库崩溃时,先做Redo Log数据恢复,然后做Undo Log 。
undo Log在Mysql中采用段的方式进行管理,在数据库文件中存在一种叫rollback segment的回滚段,在这个回滚段内部存在1024个undo log segment段。 undolog默认存储在共享数据表空间中,默认为idata1文件中。
undo log回滚段中,undo logs分为:
insert undo log(插入)
update undo log(更新和删除)
MVCC: 在数据表后面保存了两个隐藏列,保存行的创建版本、保存行的删除版本
DB_TRX_ID、DB_ROLL_PTR、DB_ROW_ID
一种记录所有Mysql数据库表结构变更以及表数据变更的二进制日志。 BinLog的使用场景: 主从复制 数据恢复
BinLog记录的模式:
row
statement
mixed
row模式:Row模式下的BinLog文件会记录每一行数据被修改情况,然后在mysql从数据库中对相同的数据进行修改。会记录每一行修改的情况。
statement模式:BinLog文件会记录每一条修改数据的Sql语句,Mysql从数据库在复制sql语句的时候,会通过sql进程将BinLog中的sql语句解析成和mysql主数据库执行过的sql语句相同的sql语句,然后在从数据库上执行sql进程解析出来的sql语句。记录数据修改的sql语句。
mixed模式:是row和statement模式的混合。
通常情况下,采用mixed模式 mysql的BinLog文件中保存了数据库、数据库表和数据表中的数据的各种更新操作。用来表示修改操作的数据结构叫做日志事件。 比较常见的日志事件: Query Event、Row Event、Xid Event等。
BinLog的写入机制: mysql事务提交的时候,会记录事务日志和BinLog日志。其中BinLog日志先于事务日志Redo Log。
根据日志记录模式和操作触发生成日志事件。
在InnoDB存储中,提交事务时,一般会进行两个阶段的操作。
1)修改内存中事务对应的信息,并将日志写入相应的Redo Log Buffer。
2)调用fsync()函数将Redo Log Buffer中的日志信息刷新到磁盘的Redo Log文件中。
1)BinLog是Mysql本身就有的,不管使用哪种引擎,都会存在BinLog,而Redo Log是InnoDB引擎特有的。
2)BinLog是一种逻辑日志,记录的是对数据库的所有修改操作,而RedoLog是一种物理日志,记录的是每个数据页的修改。
3)BinLog具有幂等性,而Redo Log不具有幂等性。
4)BinLog开启事务时,会将每次提交的事务一次性写入内存缓冲区,如果未开启事务,则每次成功执行插入、更新和删除语句时,就会将对应的事务信息写入内存缓冲区修改数据,而Redo Log是在数据准备之前将数据写入缓冲区的Redo Log中,然后在缓冲区中修改数据。而且在提交事务时,先将Redo Log写入缓冲区,写入完成后再提交事务。
5)BinLog只会在事务提交时,一次性写入BinLog,其日志的记录方式与事务的提交顺序有关。
6)BinLog是追加写入。Redo Log是循环写入,日志空间的大小是固定的。
7)BinLog一般用于主从复制和数据恢复,并且不具备崩溃自动恢复的能力,而Redo Log是在服务器发生的故障后重启Mysql,
上述内容来源于《深入分布式事务原理与实战》学习整理。