前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >mysql为什么选错索引?怎么解决?

mysql为什么选错索引?怎么解决?

作者头像
不吃西红柿
发布2022-07-29 09:54:54
5000
发布2022-07-29 09:54:54
举报
文章被收录于专栏:信息技术智库

mysql为什么选错索引?

在进行慢SQL分析的时候,有时候我们会发现explain的扫描行数和慢日志中的行数相差很大,那explain中的rows这个扫描行数是怎么判断的?

其实MySQL在真正开始执行语句之前,并不能精确的满足这个条件的记录有多少行,而只能根据统计信息来估算记录数。

这个统计信息就是索引的“区分度”,显然,一个索引上不同的值越多,这个索引的区分度就越好。而一个索引上不同的值的个数,我们称之为“基数”(cardinality)。也就是说,这个基数越高,索引的区分度越好。

日常中我们可以通过”show index from tablename”看到一个索引的基数。

MySQL怎样得到索引基数?

Mysql是通过采样统计的方法。为什么要采样统计呢?因为把整张表取出来一行行统计,虽然可以得到精确的结果,但是代价太高了,所以只能选择“采样统计”。

采样统计的时候,InnoDB默认会选择N个数据页,统计这些页面上的不同值,得到一个平均值,然后乘以这个索引的页面数,就得到了这个索引的基数。

而数据表是会持续更新的,索引统计信息也不会固定不变。所以,当变更的数据行数超过1/M的时候,会自动触发重新做一次索引统计。

在MySQL中,有两种存储索引的方式,可以通过设置参数innodb_stats_persistent的值来选择:

当设置为on的时候,表示统计信息会持久化存储。这时,默认的N是20,M是10.

设置为off的时候,表示统计信息只存储在内存中。这时,默认的N是8,M是16.

由于是采样统计,所以不管N是20还是8,这个基数都是很不准确的。

索引选择异常处理办法

  • 采用force index 强行选择一个索引。
  • 修改sql语句、引导MySQL使用我们期望的索引。
  • 在有些场景下,我们可以新建一个更适合的索引,来提供给优化器做选择,或删除掉误用的索引。

由于索引统计信息的不准确,可以用analyze table来解决。

而对于其它优化器误判断的情况,你可以在应用端用force index 来强行指定索引,也可以通过修改语句来引导优化器,还可以通过增加或者删除索引来绕过这个问题。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • mysql为什么选错索引?
  • MySQL怎样得到索引基数?
  • 索引选择异常处理办法
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档