在MySQL 5.6之前,当查询使用到复合索引时,MySQL会先根据索引的最左前缀原则,在索引上查找到满足条件的记录的主键或行指针,然后再根据这些主键或行指针到数据表中查询完整的行记录。之后,MySQL再根据WHERE子句中的其他条件对这些行进行过滤。这种方式可能导致大量的数据行被检索出来,但实际上只有很少的行满足WHERE子句中的所有条件。
为了解决这个问题,MySQL 5.6引入了索引下推优化。
(Index Condition Pushdown, ICP)是MySQL优化查询的一种方式,其核心思想是将原本在服务层(上层)进行的部分过滤操作下推到存储引擎层(下层)执行,从而减少不必要的数据行检索,提高查询效率。
我们先简单了解一下MySQL大概的架构:


索引下推优化的核心思想是将WHERE子句中的部分条件直接下推到索引扫描的过程中。这样,在扫描索引时,就可以提前过滤掉不满足条件的索引项,从而减少后续需要访问的数据行数。
具体来说,当MySQL使用ICP时,它会将WHERE子句分为两部分:
一部分是只涉及索引列的条件(称为索引条件),另一部分是涉及非索引列的条件(称为表条件)。MySQL会先将索引条件下推到索引扫描的过程中,然后再根据表条件对结果进行过滤。
通过ICP优化,可以在存储引擎层就过滤掉大量不满足条件的数据行,从而减少了数据行检索的数量和服务层过滤的工作量,提高了查询性能。尤其是在涉及到大量数据行和复杂WHERE条件的情况下,ICP优化的效果更为显著。
在MySQL中,可以通过EXPLAIN命令来查看查询的执行计划,从而判断是否使用了ICP优化。当执行计划中的Extra列显示Using index condition时,表示查询使用了ICP优化。
例如,对于以下查询:
EXPLAIN SELECT * FROM orders WHERE customer_id = 100
AND product_id > 50 AND order_date > '2022-01-01';如果Extra列显示了Using index condition,那么说明MySQL优化器选择了ICP来优化这个查询,将product_id > 50这个条件下推到了索引扫描阶段。
需要注意的是,customer_id = 100作为索引的最左前缀,是用于索引查找的基本条件,而order_date > '2022-01-01’这个条件可能仍然在服务层进行过滤,因为它涉及到非索引列。
另外,如果Extra列还显示了Using where,这表示在服务层还有额外的过滤条件。在使用ICP的情况下,Using where通常表示非索引列的条件过滤。如果只有Using where而没有Using index condition,那么可能没有使用ICP,或者查询只涉及到了非索引列的条件过滤。
ICP优化主要有以下限制:
当查询使用到复合索引,并且WHERE子句中有涉及到非索引列的条件时,ICP能够将涉及到索引列的条件下推到索引扫描的过程中,提前过滤不满足条件的索引项。
range:当使用范围查询时,ICP可以有效地在索引扫描过程中过滤不满足条件的记录。
ref、eq_ref、ref_or_null:这些访问方法通常涉及到通过索引查找单个或多个匹配的行。在这些情况下,ICP可以帮助减少不必要的行查找。
SET optimizer_switch = 'index_condition_pushdown=off';ICP优化只适用于二级索引(辅助索引)。二级索引是除了主键索引之外的索引。在InnoDB中,主键索引(聚集索引)的叶子节点直接包含行数据,而二级索引的叶子节点包含的是对应主键的值。因此,当使用二级索引进行查询时,MySQL首先查找到主键值,然后再根据主键值去查找实际的行数据。在这个过程中,ICP可以在查找主键值之前就过滤掉不满足条件的索引项,从而提高查询效率。
即使查询满足上述条件,MySQL的优化器也不一定会选择使用ICP。优化器会根据查询成本估算来决定是否使用ICP。如果优化器认为全表扫描或者其他访问方法更快,它可能不会选择ICP。
要充分利用ICP优化,除了满足上述条件外,还需要合理地设计数据库模式和索引,以及编写高效的SQL查询。同时,定期分析查询性能和执行计划,根据实际的数据分布和查询负载来调整和优化数据库设计也是非常重要的。
假设有一个名为orders的表,其中包含order_id(主键),customer_id,product_id和order_date等列,并且有一个复合索引(customer_id, product_id)。
查询语句如下:
SELECT * FROM orders WHERE customer_id = 100 AND product_id > 50 AND order_date > ‘2022-01-01’;
在这个查询中,customer_id = 100和product_id > 50是索引条件,而order_date > '2022-01-01’是表条件。
通过ICP优化,MySQL能够在索引扫描的过程中提前过滤掉不满足条件的索引项,从而减少后续需要访问的数据行数,提高查询性能。
总之,索引下推优化是MySQL 5.6引入的一项重要特性,它能够在某些查询场景下显著提高查询性能。在实际应用中,我们应该根据查询的特点和表结构,合理设计索引,并充分利用ICP优化来提高查询性能。
术因分享而日新,每获新知,喜溢心扉。 诚邀关注公众号 『
码到三十五』 ,获取更多技术资料。