MYSQL INDEX 是那么简单的吗?

平时我们在使用INDEX的时候都是那么理所应当,而原理估计了解的人不是太多。今天来说说MYSQL 的索引的一些东西,或许你已经知道了,或许你还不知道,follow me .

自从MYSQL 5.7 后,INDEX的建立不在是从顶向下的方式,而是自下向上的方式来建立索引。

一般建立一个二级索引需要的步骤

1 从聚集索引中读取相关的数据条目来进行二级索引的构建

2 进行与索引相关的归并排序

3 插入二级索引需要的记录

而传统的索引构建的方法自上而下,他会产生很多的页面的分割和页面的合并的操作,而这样的操作对于建立索引的代价是比较昂贵的。MYSQL 5.7 构建索引的方法变为从下往上的方式来进行。(用图来演示)

1 插入一个页 叶子节点

2 当叶子节点插满后,将叶子节点的指针插入到父节点

3 然后产生另外一个叶子节点,在将数据插满后连接到父节点,周而复始

4 通过上面周而复始的操作,就产生了二级的索引

但问题是大部分数据库都有一个填充因子(有的数据库不这么叫),在MYSQL 里面默认的比率是 100, 而聚簇索引则以默认 百分之6的填充因子进行设置,也就是说一个页面有百分之6是空的,为未来的DML操作进行保留。

这就牵扯到一个事情,即使默认的索引填充率应该怎么设置的问题,如果设置成80%,就是有20%的空间要留给未来的数据升级使用。

一般来说可以根据具体的数据库的大部分表的更新的度来进行 innodb_fill_factor 来进行设置。一般从 70% -90% 不等来设计,如果表是静态表,基本上不更新则 90% 即可,如果经常更新,并且有些字段的值的变动较大,则可以考虑70%。后续中的页的在拆分和合并的操作。

所以调整innodb_fill_factor 操作的主要目的

1 防止也的 splits 和 merges

2 不要经常进行数据插入位置的research

3 如果没有splits 和 merges 则 redo log 的压力就会比较小,不会进行redo log的操作

缺点也是显而易见的,就是会浪费空间。

本文分享自微信公众号 - AustinDatabases(AustinDatabases)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-07-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯云数据库(TencentDB)

邀您参加 | 腾讯云数据库行业实战分享会

All in 云计算时代,如何完成数字化转型的华丽转身是摆在企业面前的一道难题。数据作为企业的核心资产,上云后的安全合规、自主可控,成本等是核心考量要素。 与...

18030
来自专栏数据和云

史上最全分布式数据库概述

墨墨导读:在集中式数据库系统不能完全符合实际需要的形势下,集中式DB的“集中计算”概念向“分布计算”概念发展。分布计算主要体现在客户机/服务器模式的分布式数据库...

56450
来自专栏数据和云

MySQL亿级数据数据库优化方案测试-银行交易流水记录的查询

对MySQL的性能和亿级数据的处理方法思考,以及分库分表到底该如何做,在什么场景比较合适?

13340
来自专栏Linyb极客之路

简要的线上环境部署概览

所以,其实说起线上环境的部署,咱们好像都有点懂,但是又都不一定完全懂!网上的知识无穷无尽,但往往都是各司一职,对于普通同学,很难窥其全貌!

17920
来自专栏腾讯高校合作

【犀牛鸟·硬核】腾讯-华中科技大学联合实验室最新研究成果入选SIGMOD国际顶级会议研究类长文

? 前言:腾讯与华中科技大学于2018年成立智能云存储技术联合研究中心,联合研究中心旨在通过强强联合建设一流的智能云存储技术创新和人才培养平台,吸引汇聚顶尖专...

18840
来自专栏java技术大本营

拥抱开源,mybatis代码生成(一)

1. 添加了获取数据库链接信息的测试,可用于后期mybatis逆向工程,sql文件在classpath:sql/java_tools.sql

10310
来自专栏全栈技术Kojo

一次非常有意思的SQL优化经历:从30248.271s到0.001s

原文地址:https://www.toutiao.com/i6668275333034148356

10330
来自专栏Spark学习技巧

知乎质量平台的设计和实现

其中的每一项工作都产生了大量质量数据,这些数据不仅可以用来衡量 QA 团队工作的效果,我们还可以通过质量数据的发布进一步增强其他团队质量意识,更好的建设全公司的...

24550
来自专栏数据和云

记一次服务器执行MySQL耗时问题

墨墨导读:本篇记录一次服务器执行MySQL耗时的问题,耗时的问题在于一句SQL执行,耗时超过1000ms,如何解决这个问题?通过这篇文章了解下。

14630
来自专栏数据派THU

数据蒋堂 | 性能优化是个手艺活

本文共1400字,建议阅读8分钟。 大数据的技术本质就是高性能,性能优化也是程序员们的永恒话题。

11340

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励