分页控件之分页算法 —— for SQL Server 版。

上两篇随笔:

我的分页控件(未完,待续)——控件件介绍及思路

我自己写的一个分页控件(源码和演示代码)PostBack分页版 for vs2003、SQL Server

关于分页的误区

    误区1:分页的时候,只有使用存储过程,效率才高。

    误区2:忽略了索引的作用。

上两篇好像介绍的不太详细,这里详细说明一下分页控件里使用的分页算法,也就是SQL语句。

分页一般分为四种情况

1、单字段排序,排序字段没有重复值。

2、单字段排序,排序字段有重复值。

3、多字段排序,最后一个排序字段没有重复值。

4、多字段排序,最后一个排序字段有重复值。

其中第2、4 情况都可以再加一个排序字段(比如说主键),就可以转换成第三种情况。

所以分页针对1、3两种情况设置了两种分页算法。

1、单字段排序,排序字段没有重复值。

    公式:

declare @col int



select top {PageSize * (PageIndex-)+} @col = [排序字段] 

from [表名|视图名] 

[ where 查询条件 ] 

order by [排序字段] asc|desc



select top PageSize 需要显示的字段 

from [表名|视图名] 

where [排序字段] >= @col

[ and 查询条件 ]

order by [排序字段] asc|desc

    以NorthWind 数据库里的 Products 表为例,假设一页显示10条数据,CategoryID = 3 为查询条件,按照ProductID 倒序,如果想显示第二页的数据,那么SQL语句就是

declare @col int



select top  @col = ProductID from Products where CategoryID =  order by ProductID desc    



select top  * from Products where ProductID >= @col and CategoryID =  order by ProductID desc

   说明:

    第一行的定义,要根据字段类型来修改,看是比较麻烦,但是这个麻烦交给分页控件就可以了,使用者,只要设置分页控件的属性就可以了。

    第五行和第十一行,如果需要加查询条件的话就可以在这里添加。

    第三行是一个“定位”,这个可以算是SQL Server 所特有的吧,也是SQL Server 很宽容的地方。以Products 表的例子,执行完第一条select 语句之后, @col 里面记录的是 在CategoryID = 3 的记录里面,按照ProductID 倒序,排行在11位的记录的值。

    第一个select 语句定位以后,第二个select 语句就可以根据这个“位置”继续向下查找数据了。

    虽然例子里面使用了ProductID(主键)来排序,但是并不是说这个算法只能用主键来排序,哪个字段都可以,但是要符合第一种情况,就是“只有一个排序字段,且排序字段里的记录没有重复值”!

3、多字段排序,最后一个排序字段没有重复值。

    如果 Products 表想要用 UnitPrice 字段来排序怎么办呢?上面的算法是不适合的,我们需要使用另一种算法,这个和颠颠倒倒法有些类似,但是我做了一些优化。

    公式:

select [需要显示的字段] from [表名|视图名] where [主键字段] in 



    ( select top PageSize [主键字段] from 

        (select top {PageSize * PageIndex} [主键字段] , [排序字段] from     --有几个排序字段就写几个字段



            [表名|视图名] 

            [ where 查询条件 ] 

            order by 

            

                [排序字段1] asc|desc ,

                [排序字段2] desc|asc, 

                

                [主键字段] asc|desc     

        ) as aa     

        order by     

            [排序字段1] desc|asc,        --如果上面是倒序,那么这里就是正序,下同

                [排序字段2] asc|desc ,

                    

                    [主键字段] desc|asc 



    ) 



order by 

    [排序字段1] asc|desc,    --如果上面是倒序,那么这里就是正序,所谓颠颠倒倒嘛。

    [排序字段2] desc|asc,

    

    [主键字段] asc|desc

    以NorthWind 数据库里的 Products 表为例,假设一页显示10条数据,CategoryID = 3 为查询条件,按照UnitPrice 倒序,由于UnitPrice 字段可能有重复值,所以加上一个排序字段——ProductID ,即按照 UnitPrice  desc,ProductID  来排序。 如果想显示第二页的数据,那么SQL语句就是

select * from Products where ProductID in 

    ( select top  ProductID from 

        (select top  ProductID , UnitPrice from     

            Products 

            where CategoryID = 

            order by 

                UnitPrice desc ,

                ProductID      

        ) as aa     

        order by     

            UnitPrice asc,        --如果上面是倒序,那么这里就是正序,下同

                ProductID desc 

    ) 

order by 

    UnitPrice desc,    --如果上面是倒序,那么这里就是正序,所谓颠颠倒倒嘛。

    ProductID

    说明:

    1、这里查询条件加一次就可以了。

    2、是不是看 asc|desc 倒来倒去的有点晕,恩,这就对了,颠颠倒倒嘛。

    3、最主要的就是第三个select 语句,他要取从第一条数据到要显示的页的数据,可见越是后面的记录,top n 就会越大,所以这里提取的数据就要做一个精简,只写排序需要的字段(主键字段和排序字段)。

    4、第二个select 语句是去掉前面不需要的页里的数据,只保留要显示的页号里的数据。

    5、第一个select 语句,用主键字段 in () 的方式提取其他需要的字段。

    6、这种分页算法有一个小的bug,就是显示最后一页数据的时候,会多出来几条记录,不过这个bug已经在分页控件里面修正了,最后一页的分页算法,采用特殊的select语句。

    7、效率,设置好索引,效率是没有问题的,上一篇随笔已经测试过了。

    8、这种算法有一个“侵入性”,就是要求表必须有主键,而且不能是联合主键,引为要用 in 的方式查询数据。但是并没有要求主键自身必须能够排序。

测试效果

记录数:2523136条。

一页显示5条记录。

//分页算法1 单字段排序,且排序字段是聚集索引。    //1000 页以内 15毫秒    //10000页以内 30毫秒    //50000页以内 100多毫秒    //100000页以内 200多毫秒    //最后几页 第一次跳转到 4秒多    //最后几页 连续向前翻页 1秒156毫秒

   //页号大范围跳转的时候需要的时间比较长,但是也小于1秒,同时SQL Server 占用的内存有所增加 120M。最后几页时达到320M

=================================================================== 以下是多排序字段的分页情况,排序字段是 UnitPrice,ProductID      //分页算法2 无索引  首页 8秒187毫秒 。     //10 页以内 2秒812毫秒    //速度太慢下面的就不测试了

   //分页2 非聚集索引 UnitPrice  首页 468毫秒    //10 页以内 2秒671毫秒    //速度太慢下面的就不测试了

   //分页算法2 非聚集索引 UnitPrice,ProductID  首页 500毫秒    //10 页以内 2秒796毫秒    //100页以内 4秒796毫秒    //速度太慢下面的就不测试了

   //分页算法2 非聚集索引 UnitPrice,ProductID desc  首页 500毫秒    //10 页以内 0-15毫秒    //100页以内 15-46毫秒    //1000页以内 31-62毫秒    //10000页以内 100毫秒左右    //50000页以内 400-500毫秒    //100000页以内 900毫秒左右    //最后几页 第一次跳转到 4秒421毫秒    //最后几页 连续向前翻页 4秒375毫秒

   //页号大范围跳转的时候需要的时间比较长,但是也小于1秒,    //这回SQL Server 占用的内存增加幅度不大 120M左右

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏lgp20151222

ResultSet相关ResultSetMetaData详细

DatabaseMetaData 有关整个数据库的信息:表名、表的索引、数据库产品的名称和版本、数据库支持的操作。 ResultSet 关于某个表的信息或一...

1502
来自专栏坚毅的PHP

mysql数据迁移hbase问题

无法直接dump,写了java多线程程序做迁移 问题1:Operation not allowed after ResultSet closed 裸jdbc语句...

3905
来自专栏yukong的小专栏

【ssm个人博客项目实战04】mybatis实现博客类别的增删改查分页

在前面一节我们已经完成后台管理界面的一个实现,在这一节我完成其中的博客类别管理中如果分页显示博客类别信息。

1585
来自专栏杨建荣的学习笔记

简单实用的sql小技巧(第二篇)(r3笔记第86天)

ASCII和CHR 在平时的工作中,可能会在sql或者pl/sql块中嵌入特殊字符,比如空格,回车之类。这个时候可以使用ascii和chr来做字符和ascii码...

3028
来自专栏企鹅号快讯

浅谈数据库Join的实现原理

Join的实现算法有三种,分别是Nested Loops Join, Merge Join, Hash Join。 DB2、SQL Server和Oracle都...

36510
来自专栏西安-晁州

mysql随笔

Mysql学习笔记 1、操作数据库 use dataBaseName  //使用数据库 show databases   //显示所有数据库 show tabl...

2010
来自专栏JAVA同学会

solr的基本概念

  大家可以把solr搜索引擎看成一个数据库,不过是基于内存的。它可以存储信息,并且根据你的查询条件返回你想要的信息。

1502
来自专栏影子

oracle行转列、列转行、连续日期数字实现方式及mybatis下实现方式

-- 行转列 SELECT * from ( SELECT tt1.SAP_ID,TT1.dt,TT1.EFF from ( SELECT t1.SAP...

3932
来自专栏北京马哥教育

10分钟学会理解和解决MySQL乱码问题

本文将详细介绍MySQL乱码的成因和具体的解决方案。在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符...

2948
来自专栏雪胖纸的玩蛇日常

django orm 重点大全

2714

扫码关注云+社区

领取腾讯云代金券