前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Mysql学习-架构认识

Mysql学习-架构认识

作者头像
路行的亚洲
发布2020-07-16 21:35:38
3460
发布2020-07-16 21:35:38
举报
文章被收录于专栏:后端技术学习

1.Mysql的特色

和其他数据库相比,mysql即可以嵌入到应用程序中,也可以支持数据仓库,内容索引和部署软件,高可用的冗余系统,在线事务处理系统(OLTP)等各种应用类型。

Mysql最重要、最与众不同的特性:在于它的存储引擎架构,将查询处理(Query Processing)及其他系统任务(Server Task)和数据的存储/提取相分离。这样可以根据需求选择不同的数据存储方式。

2.Mysql的逻辑架构

其可分为三层:

最上层为基于网络的客户端/服务端的工具或服务类似的架构。比如:连接处理、授权认证、安全等。每个客户端连接都会在服务器进程中拥有一个线程,同时对其进行认证。

第二层:大部分Mysql的核心服务功能都在这一层,包括:解析、分析、优化、缓存以及所有的内置函数,所有跨存储引擎的功能都在这一层实现:存储过程、视图、触发器等。Mysql首先会解析查询,并创建内部数据结构(解析树),然后对其进行各种优化,包括重写查询、决定表的读取顺序,以及选择合适的引擎等。同时可以请求优化器解释(explain)优化过程的各个因素,提供优化参考。

第三层:包含了存储引擎,存储引擎负责Mysql中的存储与提取。服务器通过API与存储引擎进行通信。

3.并发控制

无论何时,只要有多个查询需要在同一时刻修改数据,都会产生并发控制的问题。在处理并发读和并发写时,可以通过实现一个由两种类型的锁组成的锁系统来解决问题。这两种类型的锁通常称为:

排他锁(execlusive lock)和共享锁(shared lock),也叫写锁(write lock)和读锁(read lock)。

其中:读锁是共享的,或者说是不互相阻塞的,写锁是排他的,也即一个读锁会阻塞其他的写锁和读锁。

由于加锁是消耗资源的,因此就会有锁策略,在锁的开销和数据的安全性之间寻求平衡。出现了表锁和行级锁。

表锁(table lock)是Mysql中最基本的锁策略,并且是开销最小的策略。加锁时,其会锁整张表。同时写锁比读锁具有更高的优先级。

行级锁(row lock)可以最大程度地支持并发处理(同时也代来最大的锁开销)。行级锁只在存储引擎层实现。

事务是一组原子性的sql查询,或者说一个独立的工作单元。其具有四个特性:ACID

原子性:atomicity,一个事务必须视为一个不可分割的最小工作单位。要么成功,要么失败。

一致性:consistency,从一个状态转成另一个一致性状态。当数据保存失败时,数据不会被提交到数据库中。

隔离性:isolation,一个事务所做的改变在最终提交前,对其他事务是不可见的。

持久性:durability,一旦事务提交,则所做的修改就会永久保存到数据库中。

事务的隔离级别:四种隔离级别

READ UNCOMMITTED:读未提交,事务中的修改,即使没有提交,对其他事务提交也都是可见的,事务可以读取未提交的数据,此时称为脏读。也即会引发脏读。

Read COMMITTED:读已提交,大多数数据库系统都会默认这个隔离级别,但Mysql不是。也称为不可重复读。一个事务开始时,只能看见已经提交的事务所做的修改。

REPEATABLE READ:可重复读,Mysql的默认级别,解决脏读的问题。保存了在此级别多次读取的数据的结果都是一样的,但此时还是会产生幻读的情况,因此InnoDB和XtraDB存储引擎通过多版本并发控制MVCC(Multiversion Concurrency Control)解决了幻读产生的问题。

SERIALIZABLE:可串行化,事务隔离的最高级别 ,强制将事务串行化执行,效率低,会存在大量锁并发竞争的情况。

4.死锁

两个或两个以上的事务在同一资源上相互引用,并请求锁定对方占用的资源,从而导致恶性循环的现象。

为了解决死锁现象,数据库系统实现了各种死锁检测和死锁超时机制。InnoDB目前处理死锁的方法是,将持有最少行级排他锁的事务进行回滚。

5. 事务日志

事务日志可以帮助提高事务的效率,使用事务日志,存储引擎在修改表的数据时只需要修改其内存的拷贝,再把该修改行为记录到持久在硬盘上的事务日志中,而不用每次将修改的数据本身持久化到磁盘,事务日志采用的是追加的方式。事务日志持久化以后,内存中被修改的数据在后台可以慢慢地刷回到磁盘。目前大多数存储引擎都是这样的实现的,称为预写式日志(Write-Ahead Logging),修改数据需要写两次磁盘。这样做的好处是即使是系统崩溃了,事务日志持久化了,机器重启之后 依然可以恢复这部分被修改的数据。

6. Mysql中的事务

Mysql提供了两种事务型的存储引擎:InnoDB和NDB Cluster。另外还有第三方的,比如XtraDB、PBXT。Mysql默认使用自动提交模式。

InnoDB采用的是两阶段锁定协议。在事务执行过程中,随时都可以执行锁定,锁只有在执行COMMIT或者ROLLBACK的时候才会释放。

7. 多版本控制MVCC

MVCC是行级锁的一个变种,但是它在很多情况下避免了加锁的操作,因此开销更低。MVCC的实现,是通过保存数据在某个时间点的快照来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现的。这两列,一个保存了行创建的时间,一个保存行的过期时间。其存储的是系统的版本号。这里类似乐观锁的并发控制版本号,进行比较。

在进行CRUD操作时,其会进行版本号的比较、保存、删除、更新等。有了版本号,就不需要加锁了,可以解决因为锁带来的开销问题。

8.Mysql 的引擎

在Mysql5.1及之前,MyISAM是默认的存储引擎,其提供了大量的特性,包括全文索引、压缩、空间函数等,但MyISAM不支持事务和行级锁,而且崩溃后无法安全恢复。

Mysql中的其他引擎:

Archive引擎:只支持Insert、Select操作。其适合日志数据采集类应用,或者一些需要更加快速插入操作的应用场合。

Blackhole引擎:可用于复制数据库到备库 ,或者做简单记录到日志。不推荐使用,由于其没有任何的存储机制。

CSV引擎:可以将普通的CSV文件作为Mysql的表来处理,且这种表不支持索引。可以在数据库运行时拷入拷出文件。

Federated引擎:是访问其他Mysql服务器的一个代理,它会创建一个到远程Mysql服务器端的客户端连接,并将查询传输到远程服务器执行,然后提取或者发送需要的数据。MariaDB使用了它的一个后续改进版本。

Memory引擎:比MyISAM快一个数量级,适合于数据不会改变,同时重启后数据丢失也没关系的场景。

其具有良好的效率:用于查询、映射表;用于缓存周期性聚合数据的结果、用于保存数据分析中产生的中间数据。

Merge引擎:MyISAM引擎的一个变种,由多个MyISAM表合并而来的虚拟表。引入分区功能后,该功能已被遗弃。

NDB集群引擎:mysql高可用、容灾的,也即Mysql 集群方案。

第三方引擎:OLAP类引擎,Percona的XtraDB存储引擎是一个基于InnoDB引擎的改进版本。

TokuDB引擎使用了一种新的叫做分形树的索引数据结构。

面向列的存储引擎:Infobright,最有名的面向列的存储引擎。其是为数据仓库、数据分析而设计的。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 后端技术学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档