排序四 希尔排序

要点

希尔(Shell)排序又称为缩小增量排序,它是一种插入排序。它是直接插入排序算法的一种威力加强版

该方法因DL.Shell于1959年提出而得名。

希尔排序的基本思想是:

把记录按步长 gap 分组,对每组记录采用直接插入排序方法进行排序。 随着步长逐渐减小,所分成的组包含的记录越来越多,当步长的值减小到 1 时,整个数据合成为一组,构成一组有序记录,则完成排序。

我们来通过演示图,更深入的理解一下这个过程。

在上面这幅图中:

初始时,有一个大小为 10 的无序序列。

第一趟排序中,我们不妨设 gap1 = N / 2 = 5,即相隔距离为 5 的元素组成一组,可以分为 5 组。

接下来,按照直接插入排序的方法对每个组进行排序。

第二趟排序中,我们把上次的 gap 缩小一半,即 gap2 = gap1 / 2 = 2 (取整数)。这样每相隔距离为 2 的元素组成一组,可以分为 2 组。

按照直接插入排序的方法对每个组进行排序。

第三趟排序中,再次把 gap 缩小一半,即gap3 = gap2 / 2 = 1。 这样相隔距离为 1 的元素组成一组,即只有一组。

按照直接插入排序的方法对每个组进行排序。此时,排序已经结束

需要注意一下的是,图中有两个相等数值的元素 55 。我们可以清楚的看到,在排序过程中,两个元素位置交换了

所以,希尔排序是不稳定的算法。

核心代码

public void shellSort(int[] list) {
 int gap = list.length / 2;
 
 while (1 <= gap) {
 // 把距离为 gap 的元素编为一个组,扫描所有组
  for (int i = gap; i < list.length; i++) {
 int j = 0;
 int temp = list[i];
 
 // 对距离为 gap 的元素组进行排序
  for (j = i - gap; j >= 0 && temp < list[j]; j = j - gap) {
                 list[j + gap] = list[j];
             }
             list[j + gap] = temp;
         }
 
         System.out.format("gap = %d:\t", gap);
         printAll(list);
         gap = gap / 2; // 减小增量
     }
 }

算法分析

希尔排序的算法性能

时间复杂度

步长的选择是希尔排序的重要部分。只要最终步长为1任何步长序列都可以工作。

算法最开始以一定的步长进行排序。然后会继续以一定步长进行排序,最终算法以步长为1进行排序。当步长为1时,算法变为插入排序,这就保证了数据一定会被排序。 Donald Shell 最初建议步长选择为N/2并且对步长取半直到步长达到1。虽然这样取可以比O(N2)类的算法(插入排序)更好,但这样仍然有减少平均时间和最差时间的余地。可能希尔排序最重要的地方在于当用较小步长排序后,以前用的较大步长仍然是有序的。比如,如果一个数列以步长5进行了排序然后再以步长3进行排序,那么该数列不仅是以步长3有序,而且是以步长5有序。如果不是这样,那么算法在迭代过程中会打乱以前的顺序,那就

不会以如此短的时间完成排序了。

已知的最好步长序列是由Sedgewick提出的(1, 5, 19, 41, 109,...),该序列的项来自

这两个算式。

这项研究也表明“比较在希尔排序中是最主要的操作,而不是交换。”用这样步长序列的希尔排序比插入排序和堆排序都要快,甚至在小数组中比快速排序还快,但是在涉及大量数据时希尔排序还是比快速排序慢。

算法稳定性

由上文的希尔排序算法演示图即可知,希尔排序中相等数据可能会交换位置,所以希尔排序是不稳定的算法。

直接插入排序和希尔排序的比较

直接插入排序是稳定的;而希尔排序是不稳定的。

直接插入排序更适合于原始记录基本有序的集合。

希尔排序的比较次数和移动次数都要比直接插入排序少,当N越大时,效果越明显。

在希尔排序中,增量序列gap的取法必须满足:最后一个步长必须是 1 

直接插入排序也适用于链式存储结构;希尔排序不适用于链式结构

完整参考代码

JAVA版本

代码实现

范例代码中的初始序列和本文图示中的序列完全一致。

 1 package notes.javase.algorithm.sort;
  2 
  3 public class ShellSort {
  4 public void shellSort(int[] list) {
  5 int gap = list.length / 2;
  6 
  7 while (1 <= gap) {
  8 // 把距离为 gap 的元素编为一个组,扫描所有组
  9 for (int i = gap; i < list.length; i++) {
 10 int j = 0;
 11 int temp = list[i];
 12 
 13 // 对距离为 gap 的元素组进行排序
 14 for (j = i - gap; j >= 0 && temp < list[j]; j = j - gap) {
 15                     list[j + gap] = list[j];
 16                 }
 17                 list[j + gap] = temp;
 18             }
 19 
 20             System.out.format("gap = %d:\t", gap);
 21             printAll(list);
 22             gap = gap / 2; // 减小增量
 23         }
 24     }
 25 
 26 // 打印完整序列
 27 public void printAll(int[] list) {
 28 for (int value : list) {
 29             System.out.print(value + "\t");
 30         }
 31         System.out.println();
 32     }
 33 
 34 public static void main(String[] args) {
 35 int[] array = {
 36                 9, 1, 2, 5, 7, 4, 8, 6, 3, 5
 37         };
 38 
 39 // 调用希尔排序方法
 40         ShellSort shell = new ShellSort();
 41         System.out.print("排序前:\t\t");
 42         shell.printAll(array);
 43         shell.shellSort(array);
 44         System.out.print("排序后:\t\t");
 45         shell.printAll(array);
 46     }
 47 }

运行结果

排序前:      9    1    2    5    7    4    8    6    3    5    
 gap = 5:    4    1    2    3    5    9    8    6    5    7    
 gap = 2:    2    1    4    3    5    6    5    7    8    9    
 gap = 1:    1    2    3    4    5    5    6    7    8    9    
 排序后:      1    2    3    4    5    5    6    7    8    9   

参考资料

《数据结构习题与解析》(B级第3版)

维基百科-希尔排序:http://zh.wikipedia.org/zh-cn/%E5%B8%8C%E5%B0%94%E6%8E%92%E5%BA%8F

相关阅读

欢迎阅读 程序员的内功——算法 系列

示例源码:https://github.com/dunwu/algorithm-notes

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏前端杂谈

前端算法-基本排序算法比较

37813
来自专栏python3

习题4:变量和命名

"_"下划线这个符号在变量里通常被用作假象的空格,用来隔开单词,切记千万不要用"-"这个符号来连接单词

582
来自专栏JavaEdge

设计模式实战 - 解释器模式(Interpreter Pattern)

● 公式可以运行时编辑,并且符合正常算术书写方式,例如a+b-c ● 高扩展性,未来增加指数、开方、极限、求导等运算符号时较少改动 ● 效率可以不用考虑,晚...

1152
来自专栏Golang语言社区

深入解析快速排序算法的原理及其Go语言版实现

快速排序是一种基于分治技术的重要排序算法。不像归并排序是按照元素在数组中的位置对它们进行划分,快速排序按照元素的值对它们进行划分。具体来说,它对给定数组中的元素...

3505
来自专栏数据结构与算法

cf314E. Sereja and Squares(dp)

给你一个擦去了部分左括号和全部右括号的括号序列,括号有25种,用除x之外的小写字母a~z表示。求有多少种合法的括号序列。答案对4294967296取模。 合法序...

1617
来自专栏CDA数据分析师

学会这8个(组)excel函数,轻松解决工作中80%的难题

文 | 兰色幻想-赵志东 函数是excel中最重要的分析工具,面对400多个excel函数新手应该从哪里入手呢?下面是实际工作中最常用的8个(组)函数,学会后工...

2017
来自专栏五分钟学算法

每天一算:Odd Even Linked List

我们会在每天早上8点30分准时推送一条LeetCode上的算法题目,并给出该题目的动画解析以及参考答案,每篇文章阅读时长为五分钟左右。

1113
来自专栏糊一笑

关于一道面试题【字符串 '1 + (5 - 2) * 3',怎么算出结果为10,'eval'除外】

最近徘徊在找工作和继续留任的纠结之中,在朋友的怂恿下去参加了一次面试,最后一道题目是: 写一个函数,输入一个字符串的运算式,返回计算之后的结果。例如这样的: ...

57010
来自专栏tkokof 的技术,小趣及杂念

sizeof 知多少?

稍熟悉C/C++的朋友,对于sizeof肯定不陌生,通过他我们可以知晓某个类型或者实例的内存大小(以字节计),但是如果深入一下sizeof计算的细节,想来大部分...

740
来自专栏青青天空树

小白详细讲解快速幂--杭电oj2035-A^B

输入数据包含多个测试实例,每个实例占一行,由两个正整数A和B组成(1<=A,B<=10000),如果A=0, B=0,则表示输入数据的结束,不做处理。

1493

扫码关注云+社区

领取腾讯云代金券