前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >B+树索引(1)简易版本索引 --mysql从入门到精通(十三)

B+树索引(1)简易版本索引 --mysql从入门到精通(十三)

作者头像
用户9919783
发布2022-07-26 12:20:34
2820
发布2022-07-26 12:20:34
举报
文章被收录于专栏:后端从入门到精通

前面我们说了innoDB有很多页类型,主要介绍了index索引页,包含七个主要部分。File header里有效验和和file_page_prev和file_page_next吧所有的页联系起来,组成双向链表。Page header里有当前页的槽点和记录数,还有next record来吧每个数据连接起来,组成单链表。查询的时候有page directory。File trailer里的效验和能检验数据是否完成。如果上面说的这些你都不明白,建议吧前面的文章再看一看,接下来的知识不适合你。什么?前面内容太多,太生涩看不懂?好的,等我!

InnoDB(7)数据持久化 --mysql从入门到精通(十二)

没有索引的情况下查找

回忆一下,如果查询主键,则会用二分查找法找到对应的槽,然后遍历该槽的记录,找到对应的数据。

如果是非主键其他列查询,因为数据页中并没有非主键页的页目录,所以无法通过二分查找法定位槽,这种情况下,只能从最小记录,依次遍历页里单链表的每条数据。

上诉是主键查找的时候,会用二分查找法找到页中对应的槽,其实不管属于不属于主键查找,找页都是在双向链表一个个遍历的,所以只能从第一个慢慢往后找,定位到字节需要的页,如果数据有上亿,这种是非常耗时的,mysql的设计者肯定不允许这种事情发生,这时候我们的索引就闪亮登场!!!

索引

先创建一个index_tb表,指定行格式为compcat,设置主键为c1,两个int类型,一个char类型c3:

代码语言:javascript
复制
mysql> create TABLE index_tb(
    -> c1 int,
    -> c2 int,
    -> c3 char(1),
    -> primary key(c1)
    -> 
    -> )row_format=Compact;
Query OK, 0 rows affected (0.04 sec)
 
 
//插入一些数据
mysql> INSERT INTO index_tb VALUES(1, 4, 'u'), (3, 9, 'd'), (5, 3, 'y');
Query OK, 3 rows affected (0.01 sec)

那我们现在表里面的数据结构就是:

record_type:记录头信息里的一项属性,表示当前记录的类型,0表示普通数据,2表示最小记录,3表示最大记录,1我们还没用到过,马上就要用到了。

next_record:记录头信息里的,下一条地址对本条地址的偏移量,方便找到下一条数据。

各个列的值:c1,c2,c3。

其他信息:记录真实数据的额外信息(null值列表,变长字段长度列表,头部信息),和其他隐藏列的值(最小隐藏列和最大隐藏列)。

一个简易版本索引

前面我们知道为了在页中快速查询数据在某个槽点中,我们有了目录page directory的概念方便我们快速查到数据,那我们查找数据在某个页时候,怎么找呢,也可以通过页目录来找到对应的页,但想通过目录查找,必须满足一些规则才可以 ,比如槽里的数据,会按主键从小到大排序,那我们页目录查找页必须满足:

1、下一个数据页中的主键必须大于上一个数据页中的主键。

前面我们已经insert了不少数据,为了我们演示,我们假设一个数据页只能存放三条数据(实际一个数据页能存放大量的数据)。

此刻我们的数据显示,record_type类型分别为:

页10:2,0,0,0,3

三个0的数据分别存储着:1,4,u;3,9,d;5,3,y。

当我们再插入一条数据,则在另一个页:

代码语言:javascript
复制
 mysql>  INSERT INTO index_tb VALUES(4, 4, 'a');
Query OK, 1 row affected (0.00 sec)

页30:2,0,3

0的数据存储着:4,4,a。

页10 和页30是正常的,因为页的分配并不是连续的,因为5>4,但为了满足条件,所以他插入的时候,会有两个步骤,第一步将主键为5的移动到页30,第二步将主键为4移动到页10。

所以在插入数据的时候,必须保证下一个页的主键必须大于上一个页的主键而做一些操作,这个过程叫做’页分裂‘。

当我们有多个页的时候,这时候如何找到页,我们要给页做一个目录,key和page_no,

key:页里的最小主键值(1,5)。

page_no:页的名称(页10,页30)。

所以我们查找的时候,1、先根据二分查找法,确定主键的值在哪个key的页目录中。

2、在找到key值对应的page_no页,去页中找到具体值。

而这个key和page_no组成的目录就叫做索引。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 后端从入门到精通 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 索引
  • 一个简易版本索引
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档