掀开SQL的神秘面纱,将优化进行到底

编辑手记:有这样一条奇怪的SQL,返回结果不足10行,逻辑读达到1.2w,存在索引却走多次全表扫描,如何揭开它神秘的面纱拯救系统性能,答案在这里,你不可错过!

在某运营商的优化经历中曾经遇到了一条比较有意思的SQL。

该最开始的sql执行情况如下:

SQL语句:

执行计划如下:

统计信息如下:

针对以上信息我们分析如下:

1) 该sql每天执行上千次,平均每次执行返回不到10行数据,但是平均逻辑读达到1.2W,可能存在性能问题。 2)ID为4,5的执行计划路径中出现了两个全表扫描,看到这儿我们可以想到可能是没有合适的索引导致走了全表扫描从而执行效率低下。 3)ID为2的执行计划路径出现了FILTER,且3,和6为其子路径,如果FILTER有两个及两个以上的子路径,那么他的执行原理将类似于嵌套循环,id号最小的子路径如果返回行数较多,可能会导致多次执行id号更小的子路径,导致性能低下。一般存在“OR EXISTS”的时候会出现此情况,可以根据情况避免。 4)存在条件“rownum<500”,但是从历史的执行情况来看,返回行数都远小于500行,此处我们先予以忽略。

处理过程:

1、进过探查,发现存在两个表都有可用的索引,且两个表都只有几十M的大小。

2、去掉“OR EXISTS”子句查看执行效率。

执行计划和统计信息如下:

此处可用看到,去掉“OR EXISTS”之后两个表走了合适的索引,并且执行效率极高。

3、去掉“OR EXISTS”中的子句查看执行效率。

SQL> SELECT A.OFFER_SPEC_GRP_ID FROM OFFER_SPEC_GRP_RELA A WHERE A.SUB_OFFER_SPEC_ID = 109910000618; OFFER_SPEC_GRP_ID ----------------- 100000048 109090086 Elapsed: 00:00:00.01

执行计划和统计信息如下:

此处可用看到“OR EXISTS”中的子句单独执行返回行数并不多,且效率依旧很快。

4、我们把该条sql语句分为“OR EXISTS”的子句和其他部分两块,到此我们可以看到,两块的执行效率都很高,但是合在一起就低了很多。在这种情况下,几乎可以确认,将该存在“OR EXISTS”的子句改写为union必将提升效率。

执行计划如下:

统计信息:

此处我们可以看到,改写之后逻辑读仅仅11,较优化前提升了上千倍。到了此处,我们已经将sql优化到几乎最快的效率了。

第二次分析,确实改写能够提升效率,但是如果改写sql会涉及到修改代码,当前能否在不修改代码的情况下对其进行优化

1)我们再来回顾一下最开始的执行计划路径。

我们可以看到“OR EXISTS”中的子句是在ID为6的路径才开始执行的,这儿有一个知识点即为一个sql中的子句,一般情况下默认会将其放到最后执行。

2)ID为4,5的执行计划路径中在有高效索引的情况下却出现了两个全表扫描,可以推断CBO可能没有正常评估执行的cost。

3)“OR EXISTS”中的子句执行效率很快,返回行数并不多,我们可以考虑提升CBO将其提前执行,看能否影响CBO选择出更高效的执行计划。

执行计划如下:

统计信息如下:

来看另外一种情况:

执行计划和统计信息如下:

此处我们在子句中加了一个HINT /*+ push_subq */ 该HINT的作用即使提醒CBO将子句提前执行。

我们可以看到,执行效率较之前也得到了显著提升,逻辑读降低了7倍作用,虽然相对于改写效率还是高很多,但是在急需处理的情况下该方案还是更加可取的,此时对执行计划进行绑定即可,无需修改代码。

4)最后执行计划中还是存在全表扫描,我使用hint使其强制走索引查看情况:

执行计划和统计信息如下:

此时虽然走了索引,但是却是”INDEX FULL SCAN“,逻辑读也增加了很多,所以此时可以保持之前全表扫描的执行计划。

索引虽好,但不是万能的,只有结合系统的具体 情况,才能选择性能最佳的SQL。

案例总结:

1)当我们看到总的逻辑读除以最后的返回的行数过大时可以认为sql确实是存在性能瓶颈的(有些时候rownum限制除外),但是这没有一个清晰的值来判断过大还是过小,需要凭借优化的经验去评估。但是1200左右逻辑读/条 这么夸张的比值还是完全可以判断的,毕竟在某些情况下两三个逻辑读就能获取上百条结果。

2)很多设计不合理的业务,没有添加合适的索引,可能会导致全表扫描,在某些情况下走全表和走索引产生性能的消耗根本不是一个数量级的。

3)filter和嵌套循环类似,可以看做是升级版的嵌套循环。而嵌套循环,oracle 从较小结果集中读取一行,然后和较大结果集中所有数据逐条进行比较,如果符合规则,就放入结果集中,然后去较小结果集的下一条数据继续进行循环,直到结束。嵌套循环只适合输出较少结果集或者用于快速输出结果集

4)某些时候符合我们限制条件的条数过多,但是我们用rownum进行条数限制之后可能会改变其选择执行计划。假如一个sql本来能够返回10000W,但是我用rownum来限制只需要500行。那么优化器会选择能够优先返回500行的执行计划。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2017-03-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java3y

数据库原理

什么是数据库? 数据库是一个以某种有组织的方式存储的数据集合。也就是:保存有组织数据的容器(一个文件或一组文件) 为什么我们需要数据库? 毫无疑问,数据库是用来...

3067
来自专栏人人都是极客

做嵌入式开发知道这些,你才看起来像个高手!

做嵌入式系统开发,经常要接触硬件,需要对数字电路和模拟电路要有一定的了解,这样才能深入的研究下去。下面我们简单地介绍一下嵌入式开发中的一些硬件相关的概念。

1062
来自专栏大数据

功能式Python中的探索性数据分析

这里有一些技巧来处理日志文件提取。假设我们正在查看一些Enterprise Splunk提取。我们可以用Splunk来探索数据。或者我们可以得到一个简单的提取并...

3001
来自专栏带你撸出一手好代码

深入浅出数据库索引

前段时间,公司一个新上线的网站出现页面响应速度缓慢的问题, 一位负责这个项目的但并不是搞技术的妹子找到我,让我想办法提升网站的访问速度 ,因为已经有很多用户来投...

3224
来自专栏达观数据

技术干货 | 搜索引擎之倒排索引解读

互联网时代,信息纷繁海量,人们通过搜索引擎直达“心中所想”已是常态。那么搜索引擎到底是如何高效查找目标内容呢?本文主要介绍搜索引擎里一个比较重要的结构——倒排索...

3414
来自专栏PPV课数据科学社区

【学习】七天搞定SAS(一):数据的导入、数据结构

标题有些噱头,不过这里的重点是: speak SAS in 7days。也就是说,知识是现成的,我这里只是要学会如何讲这门语言,而不是如何边学SAS边学模型。顺...

2395
来自专栏数据结构与算法

P1828 香甜的黄油 Sweet Butter

题目描述 农夫John发现做出全威斯康辛州最甜的黄油的方法:糖。把糖放在一片牧场上,他知道N(1<=N<=500)只奶牛会过来舔它,这样就能做出能卖好价钱的超甜...

2737
来自专栏杨建荣的学习笔记

IP地址定位区间的问题分析

以前写过一篇Oracle中关于IP地址定位的问题分析,最后引申出了一系列的问题。当时问题紧急严峻,抓取了10053事件定位源头,想出了一个解决妙法,还自鸣...

2608
来自专栏鸿的学习笔记

python源码阅读笔记之函数的运行机制

581
来自专栏杨建荣的学习笔记

基于dba_hist_sqlstat查看sql语句的性能历史(r4笔记第92天)

在生产环境中,如果系统已经稳定,调优的空间就会越来越小,但是不代表没有调优的余地,可能工作的重心就会更加求稳,sql调优就是一项不间断的工作,很多工作还是需要前...

2975

扫描关注云+社区