专栏首页艾小仙面试官:你说说一条更新SQL的执行过程?

面试官:你说说一条更新SQL的执行过程?

在上一篇《面试官:你说说一条查询SQL的执行过程?》中描述了Mysql的架构分层,通过解析器、优化器和执行引擎完成一条SQL查询的过程,那这一篇续上继续说明一条更新SQL的执行过程。

对于一个SQL语句的更新来说,前面的流程都可以说类似的,通过解析器进行语法分析,优化器优化,执行引擎去执行,这个都没有什么问题,重点在于多了一点东西,那就是redo_logundo_logbinlog

执行流程大致如下:

  1. 首先客户端发送请求到服务端,建立连接。
  2. 服务端先看下查询缓存,对于更新某张表的SQL,该表的所有查询缓存都失效。
  3. 接着来到解析器,进行语法分析,一些系统关键字校验,校验语法是否合规。
  4. 然后优化器进行SQL优化,比如怎么选择索引之类,然后生成执行计划。
  5. 执行引擎去存储引擎查询需要更新的数据。
  6. 存储引擎判断当前缓冲池中是否存在需要更新的数据,存在就直接返回,否则去从磁盘加载数据。
  7. 执行引擎调用存储引擎API去更新数据。
  8. 存储引擎更新数据,同时写入undo_log、redo_log信息。
  9. 执行引擎写binlog,提交事务,流程结束。

可以看到相比于查询流程,实际上更新多了关于undo_log和redo_log的流程,接下来再具体探讨一下这几个流程的执行过程是什么样子。

redo_log

redo_log按照字面翻译称为重做日志,是InnoDB存储引擎特有的,用于保证事务的原子性和持久性。怎么理解呢?简单来说就是保存我们执行的更新语句的记录,如果服务器或者Mysql宕机,通过redo_log可以恢复更新的数据。

按照上述流程来举例的话,比如update user set age=20 where id=1这样的简单更新SQL,我们不管执行引擎怎么拿到的数据,不管是从缓冲池拿的还是磁盘拿到的,这条现在数据都在缓冲池里面,然后去缓冲池的数据把age改成10。

缓冲池内存中的数据已经更新好了,那么接下来就该开始写redo_log了,只是redo_log也不是直接写文件的,一般都是这样对吧,直接写的话性能太差了,所以就有redo_log_buffer叫做redo_log缓冲。

在写redo_log的时候先把数据写到redo_log缓冲区,然后异步写入磁盘,很显然,极端情况下会有丢失数据的可能。

控制这个刷盘策略的的参数叫做innodb_flush_log_at_trx_commit

这个参数有3个值:0|1|2,默认的话是1。

0代表提交事务时不会写入磁盘,这样的话性能当然最好,但是在Mysql宕机的情况会丢失上一秒的事务的数据。

1代表提交事务一定会进行一次刷盘,同步当然性能最差,但是也最安全。

2代表写入文件系统的缓存,不进行刷盘。这个选项性能略差于1,Mysql宕机的话对数据没有任何影响,只有在操作系统宕机才会丢失数据,这种情况下默认Mysql每秒会执行一次刷盘。

使用0或者2虽然提高了性能,但是变相的也丧失了事务的持久性。

undo_log

重做日志保证了事务的持久性,保证能够在宕机后恢复事务的数据,那么另外一种情况就是事务在需要回滚的时候怎么办?这时候就是undo_log的作用了,它保证了事务的一致性。

对于undo_log来说,简单理解就是做了逆向操作。

比如insert一条数据,就对应生成deleteupdate语句则生成相反的更新语句,这样做到将数据修改回之前的状态。

binlog

binlog称为二进制日志,大家都很熟悉,记录了改变数据库的那些SQL语句,对于这里来说,更新语句当然是了。

通过不同于redo_log是独属于存储引擎独有的东西,binlog则是Mysql本身产生的日志。

不同于redo_log是物理日志,binlog和undo_log都属于逻辑日志。

这有什么区别呢?

简单来说,逻辑日志可以认为就是存储的SQL本身,而物理日志看看redo_log存储的是啥就知道了,关于page_id页ID,offset偏移量啊这些东西,记录的是对页的修改。

另外物理日志可以保证幂等性,而逻辑日志则不一定能,除非本身SQL就是幂等的。

上面我们提到了redo_log的刷盘策略,binlog就和它非常类似了,控制参数是sync_binlog

默认值为0,相当于是innodb_flush_log_at_trx_commit的值为2,由文件系统控制,同样如果服务器宕机,binlog丢失,当然我们也可以改成1,就和redo_log的效果是一样,每1次事务提交都同步写入磁盘。

事务

为了保证写redo_log和binlog的一致性,实际采用了二阶段提交的方式。

prepare阶段:根据innodb_flush_log_at_trx_commit设置的刷盘策略决定是否写入磁盘,标记为prepare状态。

commit阶段:写入binlog日志,事务标记为提交状态。

总结

本文分享自微信公众号 - 艾小仙(aixiaoxianren),作者:艾小仙

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-08-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 面试官:你说说一条查询SQL的执行过程?| 文末送书

    为了理解这个问题,先从Mysql的架构说起,对于Mysql来说,大致可以分为3层架构。

    艾小仙
  • 面试官:听说你sql写的挺溜的,你说一说查询sql的执行过程

    当希望Mysql能够高效的执行的时候,最好的办法就是清楚的了解Mysql是如何执行查询的,只有更加全面的了解SQL执行的每一个过程,才能更好的进行SQl的优化。

    码农编程进阶笔记
  • 面试官:说一下类加载的过程

    「对于非数组类型的加载阶段,即可以使用Java虚拟机内置的类加载器去完成,也可以使用用户自定义的类加载器去完成」

    Java识堂
  • 字节三面:详解一条 SQL 的执行过程

    天天和数据库打交道,一天能写上几十条 SQL 语句,但你知道我们的系统是如何和数据库交互的吗?MySQL 如何帮我们存储数据、又是如何帮我们管理事务?....是...

    Java程序猿
  • 头条二面: 详解一条 SQL 的执行过程|文末送书

    天天和数据库打交道,一天能写上几十条 SQL 语句,但你知道我们的系统是如何和数据库交互的吗?MySQL 如何帮我们存储数据、又是如何帮我们管理事务?....是...

    kunge
  • 面试官:说说你对keep-alive的理解是什么?怎么缓存当前的组件?缓存后怎么更新?

    keep-alive是vue中的内置组件,能在组件切换过程中将状态保留在内存中,防止重复渲染DOM

    @超人
  • 面试官:说下你对方法区演变过程和内部结构的理解

    之前我们已经了解过“运行时数据区”的程序计数器、虚拟机栈、本地方法栈和堆空间,今天我们就来了解一下最后一个模块——方法区。

    阿Q说代码
  • 面试官:java基础怎么样?多线程一定会引发多线程安全问题吗?说说你的理解

    java基础对于学习安卓是很重要的,比如说线程,多线程。我们做安卓开发可能不太需要去研究高并发这些高深的问题,但是基础的知识要掌握,特别是要理解为什么会这样?以...

    Android技术干货分享
  • 【MySQL】面试官问我:MySQL如何实现无数据插入,有数据更新?我是这样回答的!

    作者个人研发的在高并发场景下,提供的简单、稳定、可扩展的延迟消息队列框架,具有精准的定时任务和延迟队列处理功能。自开源半年多以来,已成功为十几家中小型企业提供了...

    冰河
  • mybatis 逆向工程使用姿势不对,把表清空了,心里慌的一比,于是写了个插件。

    大家好,我是 why。时间过的真是快,一周又要结束了。那么,你比上周更博学了吗?先来一个简短的荒腔走板,给冰冷的技术文注入一丝色彩。

    why技术
  • 被敖丙用烂的「数据库调优」连招?真香,淦!

    哈哈开头这个场景是我臆想的一个面试场景,但是大家是不是觉得很真实,每个人的简历上但凡写到了数据库,都会在后面顺便写一句,会数据库调优。

    敖丙
  • 为什么要使用存储过程?

    项目组,几乎每个面试官问到数据库的时候都要问用没用过存储过程,烦人不?大家去面的程序员,又不是

    MonroeCode
  • 京东面试:说说MySQL的架构体系

    虽然他搞java开发好几年了,也一直使用的是MySQL数据库,但是面对这个问题依然是一脸懵逼,还以为面试官要问索引、慢查询、性能优化之类的(因为这些都是网上找点...

    田维常
  • 存储过程的优缺点

    http://blog.csdn.net/jackmacro/article/details/5688687

    bear_fish
  • 教你几招,快速创建 MySQL 五百万级数据,愉快的学习各种优化技巧

    如果你打算好好学习一下 MySQL,性能优化肯定是绕不过去一个问题。当你撸起袖子准备开始的时候,突然发现一个问题摆在眼前,本地数据库中没那么大的数据量啊,几条数...

    古时的风筝
  • 不想做技术总监的项目经理,不是好程序员

    请看我上文十年风雨,一个普通程序员的成长之路(七)膨胀、骄傲,程序员转项目经理的原罪

    IT大咖说
  • 为什么代码规范要求SQL语句不要过多的join?

    面试官:sync; echo 3 > /proc/sys/vm/drop_caches就可以清理buff/cache了,你说说我在线上执行这条命令做好不好?

    lyb-geek
  • 初级.NET程序员,你必须知道的EF知识和经验

    注意:以下内容如果没有特别申明,默认使用的EF6.0版本,code first模式。 推荐MiniProfiler插件 工欲善其事,必先利其器。 我们使用EF和...

    逸鹏
  • 我给Apache顶级项目提了个Bug

    这篇文章记录了给 Apache 顶级项目 - 分库分表中间件 ShardingSphere 提交 Bug 的历程。

    why技术

扫码关注云+社区

领取腾讯云代金券