专栏首页bigsai排序|优先队列不知道,先看看堆排序吧

排序|优先队列不知道,先看看堆排序吧

前言

在个人的专栏中,其他排序陆陆续续都已经写了,而堆排序迟迟没有写,趁着国庆假期的尾声,把堆排序也写一写。

对于常见的快排、归并这些O(nlogn)的排序算法,我想大部分人可能很容易搞懂,但是堆排序大部分人可能比较陌生,或许在Java的comparator接口中可能了解一点。但堆排序在应用中比如优先队列此类维护动态数据效率比较高,有着非常广泛的应用。

而堆排序可以拆分成排序,其中你可能对堆比较陌生,对排序比较熟悉,下面就带你彻底了解相关内容。

什么是堆?

谈起堆,很多人第一联想到的是土堆,而在数据结构中这种土堆与完全二叉树更像,而堆就是一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树(完全)的数组对象。且总是满足以下规则:

  • 堆是一棵完全二叉树
  • 每个节点总是大于(或小于)它的孩子节点。

完全二叉树 我想什么是完全二叉树大部分人也是知道:最后一层以上都是满的,最后一层节点从左到右可以排列(有任何空缺即不满足完全二叉树)。

看作树的数组对象 我们都知道我们排序的对象一般都是对数组之类的序列进行排序,如果转成抽象数据结构再实现可能成本比较大。

我们正常在构造一棵二叉树的时候通常采用链式left,right节点,但其实二叉树的表示方式用数组也可以实现,只不过普通的二叉树如果用数组储存可能空间利用 效率会很低而很少采用,但我们的堆是一颗完全二叉树。使用数组储存空间使用效率也比较高,所以在形式上我们把这个数组看成对应的完全二叉树,而操作上可以直接操作数组也比较方便。

在这里插入图片描述

大根堆 VS 小根堆 上面还有一点就是在这个完全二叉树中所有节点均大于(或小于)它的孩子节点,所以这里就分为两种情况

  • 如果所有节点大于孩子节点值,那么这个堆叫做大根堆,堆的最大值在根节点。
  • 如果所有节点小于孩子节点值,那么这个堆叫做小根堆,堆的最小值在根节点。

堆排序

通过上面的介绍,我想你对堆应该有了一定的认识,堆排序肯定是借助堆实现的某种排序,其实堆排序的整体思路也很简单,就是

  • 构建堆,取堆顶为最小(最大)。
  • 将剩下的元素重新构建一个堆,取堆顶,一直到元素取完为止。

建堆

如果给一个无序的序列,首先要给它建成一个堆,我们如何实现这个操作呢?以下拿一个小根堆为例进行分析。

对于二叉树(数组表示),我们从下往上进行调整,从第一个非叶子节点开始向前调整,对于调整的规则如下:

①对于小根堆,当前节点与左右孩子比较,如果均小于左右孩子节点,那么它本身就是一个小根堆,它不需要做任何改变,如果左右有孩子节点比它还小,那么就要和最小的那个进行替换。

②但是普通节点替换可能没问题,对于某些和子节点替换有可能改变子树成堆,所以需要继续往下判断交换(最差判断到叶子节点)。

分析构造堆的这个过程,每个非叶子节点都需要判断比较是否交换,这样一层就是O(n),而每个节点可能替换之后影响子节点成堆需要再往下判断遍历,你可能会认为它是一个O(nlogn),但其实你看看二叉树性值,大部分都是在底部的,上面的只有很少个数,如果你用数学方法去求得最终的复杂度它还是一个O(n)级别,这里就不作详细介绍了。

一个大根堆建立过程也是一样的:

堆排序

上面的一个堆建造完毕之后,我们怎么去利用这个堆实现排序呢?答案也是很简单的,我们知道堆有一个特性就是堆顶是最小(或最大),而我们建造这个如果去除第一个元素,剩余左右孩子依然满足堆的性质

最后一个元素放置堆顶,由于第一个元素的存在使得整个不满足堆的性质。分析这个结构,和我们前面构造堆的过程中构造到第一个元素的操作相同:

  • 判断左右孩子,如果需要交换则交换,交换后再次考虑交换子节点是否需要交换。一直到不需要考虑。

这样到最后,堆排序即可完成,最终得到的序列即为堆排序序列。

一个大根堆的排序过程如下:

具体实现

有了上述的思想之后,如何具体的实现这个堆排序的代码呢? 从细致的流程来看,大概流程是如下的:

给定数组建堆(creatHeap)

  • 从第一个非叶子节点开始判断交换下移(shiftDown),使得当前节点和子孩子能够保持堆的性值
  • 如果交换打破子孩子堆结构性质,那么就要重新下移(shiftDown)被交换的节点一直到停止。

堆构造完成,取第一个堆顶元素为最小(最大),剩下左右孩子依然满足堆的性值,但是缺个堆顶元素,如果给孩子调上来,可能会调动太多并且可能破坏堆结构。

  • 所以索性把最后一个元素放到第一位。这样只需要判断交换下移(shiftDown),不过需要注意此时整个堆的大小已经发生了变化,我们在逻辑上不会使用被抛弃的位置,所以在设计函数的时候需要附带一个堆大小的参数。
  • 重复以上操作,一直堆中所有元素都被取得停止。

而堆算法复杂度的分析上,之前建堆时间复杂度是O(n)。而每次删除堆顶然后需要向下交换,每个个数最坏为logn个。这样复杂度就为O(nlogn).总的时间复杂度为O(n)+O(nlogn)=O(nlogn).

具体实现的代码如下:

import java.util.Arrays;

public class 堆排序 {

    static void swap(int arr[],int m,int n)
    {
        int team=arr[m];
        arr[m]=arr[n];
        arr[n]=team;
    }
    //下移交换 把当前节点有效变换成一个堆(小根)
    static void shiftDown(int arr[],int index,int len)//0 号位置不用
    {
        int leftchild=index*2+1;//左孩子
        int rightchild=index*2+2;//右孩子
        if(leftchild>=len)
            return;
        else if(rightchild<len&&arr[rightchild]<arr[index]&&arr[rightchild]<arr[leftchild])//右孩子在范围内并且应该交换
        {
            swap(arr, index, rightchild);//交换节点值
            shiftDown(arr, rightchild, len);//可能会对孩子节点的堆有影响,向下重构
        }
        else if(arr[leftchild]<arr[index])//交换左孩子
        {
            swap(arr, index, leftchild);
            shiftDown(arr, leftchild, len);
        }
    }
    //将数组创建成堆
    static void creatHeap(int arr[])
    {
        for(int i=arr.length/2;i>=0;i--)
        {
            shiftDown(arr, i,arr.length);
        }
    }
    static void heapSort(int arr[])
    {
        System.out.println("原始数组为         :"+Arrays.toString(arr));
        int val[]=new int[arr.length]; //临时储存结果
        //step1建堆
        creatHeap(arr);
        System.out.println("建堆后的序列为  :"+Arrays.toString(arr));
        //step2 进行n次取值建堆,每次取堆顶元素放到val数组中,最终结果即为一个递增排序的序列
        for(int i=0;i<arr.length;i++)
        {
            val[i]=arr[0];//将堆顶放入结果中
            arr[0]=arr[arr.length-1-i];//删除堆顶元素,将末尾元素放到堆顶
            shiftDown(arr, 0, arr.length-i);//将这个堆调整为合法的小根堆,注意(逻辑上的)长度有变化
        }
        //数值克隆复制
        for(int i=0;i<arr.length;i++)
        {
            arr[i]=val[i];
        }
        System.out.println("堆排序后的序列为:"+Arrays.toString(arr));

    }
    public static void main(String[] args) {
        int arr[]= {14,12,16,8,9,1,14,9,6 };
        heapSort(arr);  
    }

}

执行结果:

在这里插入图片描述

当然,代码为了成章节我把它命名为中文,还有些不规范的地方请注意甄别。

结语

对于堆排序就先介绍到这里了,当然堆的强大之处不止这么一点,优先队列同样也是用到堆但是这里就不详细介绍了,我相信优秀的你肯定又掌握了一门O(nlogn)级别的排序算法啦。如果写的有啥不确切地方还请指正。

本文分享自微信公众号 - bigsai(bigsai),作者:bigsai

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-10-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 剑指offer(01-15题)优化题解

    思路: 选定一个维度(行或列)先找到需要查找的元素所在的行(列),再从该行(列)找到该元素的该元素具体的列(行)位置。复杂度O(n)。

    bigsai
  • 「干货总结」程序员必知必会的十大排序算法

    身为程序员,十大排序是是所有合格程序员所必备和掌握的,并且热门的算法比如快排、归并排序还可能问的比较细致,对算法性能和复杂度的掌握有要求。bigsai作为一个负...

    bigsai
  • 16张图带你彻底搞懂基数排序

    在排序算法中,大家可能对桶排序、计数排序、基数排序不太了解,不太清楚其算法的思想和流程,也可能看过会过但是很快就忘记了,但是不要紧,幸运的是你看到了本篇文章。本...

    bigsai
  • 极客算法训练笔记(八),十大经典排序之堆排序,被树耽误的数组

    堆排序在排序复杂性的研究中有着重要的地位,因为他是我们所知的唯一能够同时最优的利用空间和时间的方法,当空间十分紧张的时候(例如嵌入式系统或者低成本的移动设备中)...

    阿甘的码路
  • 堆排序

    用户6055494
  • 排序算法 --- 堆排序

    可以发现,arr[i] > arr[2*i + 1],arr[i] > arr[2*i + 2]。

    贪挽懒月
  • [算法题] 大数减法运算

    //test.h #ifndef _TEST_H #define _TEST_H #include <stdlib.h> #define MAXSIZE 50...

    静默虚空
  • 用大顶堆实现数据排序

    堆分为大顶堆和小顶堆 大顶堆 每个节点的值都大于或等于其左右孩子节点的值 小顶堆 每个节点的值都小于或等于其左右孩子节点的值

    shengjk1
  • 奇偶排序

    原理 奇偶排序法的思路是在数组中重复两趟扫描。第一趟扫描选择所有的数据项对,a[j]和a[j+1],j是奇数(j=1, 3, 5……)。如果它们的关键字的值次序...

    苦咖啡
  • leetcode之最小绝对差

    这里先对数组进行排序,然后遍历数据判断前后差的绝对值,看是否比存储的绝对差小,若小则情况结果集,更新最小绝对差;若等于则追加该记录到结果集。

    codecraft

扫码关注云+社区

领取腾讯云代金券