让SQL成为一种生活方式:认识分页查询

1分页查询的书写方式

分页的目的就是控制输出结果集大小,将结果尽快的返回

Oracle的分页查询语句有两种基本格式。第一种格式如下:

上面给出的这个分页查询语句,在大多数情况拥有较高的效率。其中最内层的查询SELECT * FROM TABLE_NAME表示不进行翻页的原始查询语句。ROWNUM<= 40和RN >= 21控制分页查询的每页的范围。

第二种方式是去掉查询第二层的WHERE ROWNUM <= 40语句,在查询的最外层控制分页的最小值和最大值。语法如下:

对比这两种写法,绝大多数的情况下,第一个查询的效率比第二个高得多。这是由于CBO优化模式下,Oracle可以将外层的查询条件推到内层查询中,以提高内层查询的执行效率。

对于第一个查询语句,第二层的查询条件WHERE ROWNUM <= 40就可以被Oracle推入到内层查询中,这样Oracle查询的结果一旦超过了ROWNUM限制条件,就终止查询将结果返回了。而第二个查询语句,由于查询条件BETWEEN 21 AND 40是存在于查询的第三层,而Oracle无法将第三层的查询条件推到最内层(即使推到最内层也没有意义,因为最内层查询不知道RN代表什么)。因此,对于第二个查询语句,Oracle最内层返回给中间层的是所有满足条件的数据,而中间层返回给最外层的也是所有数据。数据的过滤在最外层完成,显然这个效率要比第一个查询低得多。

上面分析的查询不仅仅是针对单表的简单查询,对于最内层查询是复杂的多表联合查询或最内层查询包含排序的情况一样有效。

下面简单讨论一下多表联合的情况。对于最常见的等值表连接查询,CBO一般可能会采用两种连接方式NESTED LOOP和HASH JOIN(MERGE JOIN效率比HASH JOIN效率低,一般CBO不会考虑)。在这里,由于使用了分页,因此指定了一个返回的最大记录数,NESTED LOOP在返回记录数超过最大值时可以马上停止并将结果返回给中间层,而HASHJOIN必须处理完所有结果集(MERGE JOIN也是)。那么在大部分的情况下,对于分页查询选择NESTED LOOP作为查询的连接方法具有较高的效率(分页查询的时候绝大部分的情况是查询前几页的数据,越靠后面的页数访问几率越小)。

因此,如果不介意在系统中使用HINT的话,可以将第一种分页查询语句改写为:

2分页查询的效率

接下来用几个例子来说明分页查询的效率。首先构造一个比较大的表作为测试表

表已创建。

首先比较两种分页方法的区别:

PL/SQL 过程已成功完成。

第一种查询方式

执行计划和统计信息如下

第二种方式如下:

执行计划和统计信息如下:

二者执行效率相差很大,第二种需要8000多逻辑读,而第一种只需要5个逻辑读。观察二者的执行计划可以发现,两个执行计划唯一的区别就是第一个查询在COUNT这步使用了STOPKEY,也就是说,Oracle将ROWNUM <= 20推入到查询内层,当符合查询的条件的记录达到STOPKEY的值,则Oracle结束查询。

因此,可以预见,采用第一种方式,在翻页的开始部分查询速度很快,越到后面,效率越低,当翻到最后一页,效率应该和第二种方式接近。验证如下:

执行计划和统计信息如下:

关于分页查询的内容情况比较复杂,今天先介绍简单的使用方法,后期会继续分享给大家。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2016-10-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏我的博客

PHP应用技术之——操纵Word

本人测试成功,但是我省略了数据库连接部分代码。其中$Table_Word=word;而word表中字段依次是id、name、qq、add、tel,将代码先留下来...

2995
来自专栏Fish

从零爬着学spark

为啥叫爬着学 在此之前,我连spark是什么都不清楚,在看完《Spark快速大数据分析》(Learning Spark:Lighting-fast Data A...

1757
来自专栏linux驱动个人学习

ARM有几条memory barrier 的指令?分别有什么区别?

(1)数据存储屏障( Data Memory Barrier,DMB) 数据存储器隔离。DMB指令保证:仅当所有在它前面的存储器访问操作都执行完毕后,才提交(...

1043
来自专栏和蔼的张星的图像处理专栏

1.处理视频的两个类VideoCapture和VideoWriter

昨天要处理一个视频,只想要某些帧,手边没有剪视频的软件,正好想着写一个小程序来弄这个,也是很久没有写过opencv的程序了,练练手。 自然是先去查了一下视频读...

974
来自专栏数据和云

【新特性视频第2期】关于IMEU与Expression Statistics Store

新特性5分钟,带你循序渐进了解Oracle 12.2的最新特性。优秀就是每天进步一点点。 上一期视频回顾: 【视频】In Memory的内部结构和实现机制 {...

2619
来自专栏数据小魔方

左手用R右手Python系列——数据合并与追加

今天这篇跟大家介绍R语言与Python数据处理中的第二个小知识点——数据合并与追加。 针对数据合并与追加,R与Python中都有对应的函数可以快速完成需求,根据...

3597
来自专栏https://www.cnblogs.com/L

Hive篇---Hive使用优化

本节主要描述Hive的优化使用,Hive的优化着重强调一个 把Hive SQL 当做Mapreduce程序去优化 二.主要优化点

1081
来自专栏生信宝典

不用Linux也可以的强大文本处理方法

标题党了,其实是论VIM的使用。 做生物信息分析最合适的还是Linux操作系统,所以生信宝典在最开始就推出了Linux学习系列,由浅入深的讲述了Linux学习中...

1746
来自专栏用户画像

sql sever 索引

微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,...

594
来自专栏Seebug漏洞平台

Exim Off-by-one(CVE-2018-6789)漏洞复现分析

前段时间meh又挖了一个Exim的RCE漏洞[1],而且这次RCE的漏洞的约束更少了,就算开启了PIE仍然能被利用。虽然去年我研究过Exim,但是时间过去这么久...

772

扫码关注云+社区