前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >算法基础--堆排序

算法基础--堆排序

作者头像
刀刀老高
发布2019-03-06 10:37:45
6010
发布2019-03-06 10:37:45
举报
文章被收录于专栏:奇点大数据
本文只是自己的笔记,并不具备过多的指导意义。

为了理解很多都使用了递归,而不是自己通过while进行压栈处理。 代码的初衷是便于理解,网上大神优化过的代码很多,也不建议在项目中copy本文代码。

堆的结构

堆实际上是一颗完全二叉树形式的数组

  • 满二叉树

对于国内的满二叉树

除最后一层无任何子节点外,每一层上的所有结点都有两个子结点二叉树。

从图形形态上看,满二叉树外观上是一个三角形

国内的满二叉树属于完全二叉树

对于国外的满二叉树

满二叉树的结点要么是叶子结点,度为0,要么是度为2的结点,不存在度为1的结点。

完全二叉树

在满二叉树的基础上,最后一层所有的结点都连续集中在最左边,这就是完全二叉树。

数组与完全二叉树

如果从下标从1开始存储,则编号为i的结点的主要关系为: 双亲:下取整 (i/2) 左孩子:2i 右孩子:2i+1

如果从下标从0开始存储,则编号为i的结点的主要关系为:

双亲:下取整 ((i-1)/2)

左孩子:2i+1

右孩子:2i+2

这个规律,通常用来对通过指定下标取得相关节点下标。

大根堆&&小根堆

处理最值问题时,堆的调整复杂度远低于其他结构。

大根堆

任一节点的关键码均大小于等于它的左右孩子的关键码,位于堆顶节点的关键码最大

小根堆

任一节点的关键码均小于等于它的左右孩子的关键码,位于堆顶节点的关键码最小。

优先级队列用大小堆的方式更容易实现

如果我们给每个元素都分配一个数字来标记其优先级,不妨设较小的数字具有较高的优先级,这样我们就可以在一个集合中访问优先级最高的元素并对其进行查找和删除操作了。

对于这种最值问题,堆的调整复杂度远低于其他结构。
而使用大根堆的方式,每次新入队元素最多只需要堆整个结构进行LogN次的调整,便可以让堆结构重归有序。

40亿的量级甚至只需要32次调整就可以实现。

用数组,建立大根堆二叉树

将数组中元素依次放入完全二叉树中,若大于父节点则依次比对交换。保证时刻处于大根堆排序 第i个数字被插入时排序的时间复杂度与高叉树高度相等,即O(Logi)。 所有数字都插入依次的时间复杂度收敛于O(N)

代码语言:javascript
复制
//大根堆排序
func maximumHeapSort(arr:inout [Int]) {
    if arr.count < 2 {
        return
    }
    //大根堆排序
    for i in 0..<arr.count {
        heapInsert(arr: &arr, index: i)
    }
}

//分段大根堆排序
func heapInsert(arr:inout [Int] ,index:Int){

    //当前节点位置
    var currentIndex = index
    //父节点位置
    var parentIndex = (index - 1)/2

    //如果当前节点大于父节点,则进行交换然后继续检查
    while arr[currentIndex] > arr[parentIndex] {
        arr.swapAt(currentIndex, parentIndex)
        currentIndex = parentIndex
        parentIndex = (currentIndex - 1)/2
    }

}

向下调整

在一个大根堆中,某个位置的数被改变(并且变小)了。重新对堆数组进行调整

比对该位置与其左右子节点,并且与较大的一个进行交换,依次向下进行。

代码语言:javascript
复制
func heapify (arr:inout Array<Int>,index:Int,heapSize:Int){
    var currentIndex = index;
    var left=2*currentIndex+1//左节点位置
    var right=left+1//右节点位置
    var largest = currentIndex //最大位置暂定为current
    while left<=heapSize {//保证左节点不越界

        largest = right<=heapSize && arr[right] > arr[left] ?right:left //左右节点的最大值位置(右节点越界则取左)

        largest = arr[largest]>arr[currentIndex] ? largest:currentIndex

        if largest == currentIndex {
            break //如果当前已经为最大位置,则结束
        }

        arr.swapAt(currentIndex, largest)//交换当前位置与左右两端最大位置

        currentIndex = largest//将当前位置下移
        left=2*currentIndex+1//左节点新位置
        right=left+1//右节点新位置
    }
}

堆排序

先构建出一个大根堆,然后依次将头部最大值转移到有效数组的最后一位,并且将排序区域前移。

代码语言:javascript
复制
func heapSort(arr:inout [Int]) {
    maximumHeapSort(arr:&arr)//先构建出一个大根堆
    let size = arr.count

    for i in 0..<arr.count {
        arr.swapAt(size-1-i, 0) //将大根堆头部最大值,移到有效数组末尾。
        heapify(arr: &arr, index: 0, heapSize: size-i-2)//将数组有效size前移,重新调整成大根堆
    }
}

其中构建初始堆经推导复杂度为O(n),在交换并重建堆的过程中,需交换n-1次,而重建堆的过程中,根据完全二叉树的性质,[log2(n-1),log2(n-2)...1]逐步递减,近似为nlogn。所以堆排序时间复杂度一般认为就是O(nlogn)级。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-01-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能工场AIWorkshop 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 本文只是自己的笔记,并不具备过多的指导意义。
  • 对于国外的满二叉树
  • 完全二叉树
    • 数组与完全二叉树
    • 大根堆&&小根堆
      • 大根堆
        • 小根堆
          • 优先级队列用大小堆的方式更容易实现
            • 对于这种最值问题,堆的调整复杂度远低于其他结构。
              • 而使用大根堆的方式,每次新入队元素最多只需要堆整个结构进行LogN次的调整,便可以让堆结构重归有序。
              • 用数组,建立大根堆二叉树
              • 向下调整
              • 堆排序
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档