MySQL多表关联查询优化

全栈程序员站长

发布于 2022-09-02 10:42:26

3.7K0

文章被收录于专栏：全栈程序员必看全栈程序员必看

大家好，又见面了，我是你们的朋友全栈君。

背景

最近在对运营报表导出进行优化，总结了一些多表关联查询优化的点记录一下。

避免临时表

通过 Explain 分析 SQL 语句，尽量不要使用到临时表。GROUP BY （Explain具体详解，可以看这篇博客）

最容易造成使用临时表，GROUP BY 与临时表的关系 : 　　1. 如果GROUP BY 的列没有索引,产生临时表. 　　2. 如果GROUP BY时,SELECT的列不止GROUP BY列一个,并且GROUP BY的列不是主键 ,产生临时表. 　　3. 如果GROUP BY的列有索引,ORDER BY的列没索引.产生临时表. 　　4. 如果GROUP BY的列和ORDER BY的列不一样,即使都有索引也会产生临时表. 　　5. 如果GROUP BY或ORDER BY的列不是来自JOIN语句第一个表.会产生临时表. 　　6. 如果DISTINCT 和 ORDER BY的列没有索引,产生临时表. 如果业务需求没法更改，也不需要强制去掉临时表。

缩小数据范围

接下来进行优化第二步，将临时表缩小到最小范围。SQL 执行过程大体如下：

执行FROM语句
执行ON过滤
添加外部行
执行where条件过滤
执行group by分组语句
执行having
select列表
执行distinct去重复数据
执行order by字句
执行limit字句

当两个表进行Join操作时，主表的Where限制可以写在最后，但从表分区限制条件不要写在Where条件中，建议写在ON条件或者子查询中。主表的分区限制条件可以写在Where条件中（最好先用子查询过滤）。示例如下：

select * from A join (select * from B where dt=20150301)B on B.id=A.id where A.dt=20150301； 
select * from A join B on B.id=A.id where B.dt=20150301； --不允许 
select * from (select * from A where dt=20150301)A join (select * from B where dt=20150301)B on B.id=A.id；

第二个语句会先Join，后进行分区裁剪，数据量变大，性能下降。在实际使用过程中，应该尽量避免第二种用法。

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/138924.html原文链接：https://javaforall.cn

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2022年5月3，如有侵权请联系 cloudcommunity@tencent.com 删除

sql