专栏首页算法channel求两个有序数组合并后的中位数,最透讲解| 腾讯面试编程50题(三)

求两个有序数组合并后的中位数,最透讲解| 腾讯面试编程50题(三)

本文是我的第303篇原创

摘要

本文是腾讯50道常考编程题之一:求解两个有序数组合并后的中位数,属于 "Hard" 难度,在校招中难倒一大波校招生。本文提供一种基本解法:基于归并排序。并对归并排序可能不是很了解的同学,提供了图解归并排序的讲解。

题目

给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。你可以假设 nums1 和 nums2 不会同时为空。

示例 1:

nums1 = [1, 3]
nums2 = [2]

则中位数是 2.0

示例 2:

nums1 = [1, 2]
nums2 = [3, 4]

则中位数是 (2 + 3)/2 = 2.5

分析

熟悉「归并排序」的同学( 对于不熟悉的下面也会图文阐述下 ),应该很快就能想出这个题目的解题思路,这个方法我认为也是这道题最直接的一种解法,并且也能满足求解时间复杂度的要求 O(m+n),只不过需要占用O(m+n)的空间,但是题目未作要求。

完整代码

class Solution:
    def findMedianSortedArrays(self, nums1: List[int], nums2: List[int]) -> float:
        nums = []
        m, n = len(nums1), len(nums2)
        if m==0:
            if n%2 == 0:
                return (nums2[int(n / 2) - 1] + nums2[int(n / 2)]) / 2.0
            else:
                return nums2[int(n / 2)]
        if n == 0:
            if m %2 == 0:
                return (nums1[int(m / 2) - 1] + nums1[int(m / 2)]) / 2.0
            else:
                return nums1[int(m / 2)]
        count = 0
        i, j = 0, 0
        while count != m+n:
            if i == m:
                while j!= n:
                    nums.append(nums2[j])
                    count, j = count+1, j+1
                break
            if j == n:
                while i != m:
                    nums.append(nums1[i])
                    count, i = count+1, i+1
                break
            
            if nums1[i] < nums2[j]:
                nums.append(nums1[i])
                count, i = count+1, i+1
            else:
                nums.append(nums2[j])
                count, j = count+1, j+1
        
        ind = int(count / 2)
        if count %2 == 0:
            return (nums[ind - 1] + nums[ind]) / 2.0
        else:
            return nums[ind]

下文是我在2017年10月31日编写的,那时公众号还叫 算法channel,那时关注我的人只有几十个,可能现在大部分同学都没看到。现在经过整理后,附录到这里,希望能对不熟悉归并排序的同学有所帮助。

归并排序 图文讲解

归并思想

归并排序,英文名称是MERGE-SORT。

它是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。

将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。

算法的核心概念---二路归并

若将两个有序表合并成一个有序表,称为二路归并。

归并过程

  1. 比较 a[i] 和 b[j] 的大小,若 a[i]≤b[j],则将第一个有序表中的元素a[i]复制到 r[k] 中,并令i 和 k 分别加上1;否则将第二个有序表中的元素b[j]复制到r[k] 中,并令 j 和 k 分别加上1;
  2. 如此循环下去,直到其中一个有序表取完;
  3. 然后再将另一个有序表中剩余的元素复制到 r 中从下标 k 到下标t的单元。

这个过程,请见下面的例子演示。

二路归并例子演示

如下图所示,初始状态时,a序列[2,3,5]和b序列[2,9]为已排序好的子序列,现在利用二路归并,将a和b合并为有序序列 r,初始时,i指向a的第一个元素,j指向b的第一个元素,k初始值等于0。

说明,r中最后一个元素起到哨兵的作用,灰色显示。

第一步,比较a[i]和b[j],发现相等,如果规定相等时,a的先进入r,则如下图所示,i, k分别加1,为了形象化,归并后的元素不再绘制。

第二步,继续比较,此时b[j]小,所以b的元素2进入r,则如下图所示,j, k分别加1,

第三步,继续比较,此时a[i]小,所以a的元素3进入r,则如下图所示,i, k分别加1,

第四步,继续比较,此时a[i]小,所以a的元素5进入r,则如下图所示,i, k分别加1,此时序列a的3个元素已经归并完,b中还剩下一个,这个可以通过k可以看出,它还没有到达个数5。

第五步,将序列b中的所有剩余元素直接放入r中即可,不用做任何比较了,直至b变空,二路归并结束。

归并算法

归并排序的算法我们通常用递归实现。

  1. 先把待排序区间 [s,t] 以中点二分;
  2. 接着把左边子区间排序;
  3. 再把右边子区间排序;
  4. 最后把左区间和右区间用一次归并操作合并成有序的区间 [s,t] 。

归并排序的例子

我们仍然用冒泡排序和其改进后的快速排序算法直接选择排序和堆排序算法直接插入排序到希尔排序做的改进这三篇中用到的待排序列

3 2 5 9 2

归并排序的伪代码

sort(unsorted, start, end, sorted)
{
       if(start<end) {
            mid = start + (end-start)/2; //分隔区间
            sort(unsorted, start,mid,sorted);
            sort(unsorted,mid+1,end,sorted);
           merge(unsorted,start,mid,end,sorted);
      }
}

下图演示的是归并排序递归版,第一次执行二路归并时的示意图,注意观察右图的栈的入栈顺序,

可以看到sort的入栈顺序,当执行一次merge时,一定是有2个sort返回并有序了,如下图,sort[0,0]和sort[1,1](递归返回的条件是start<end)都返回了,然后执行到merge,执行完merge后,sort[0,1]出栈,此时的栈顶为sort[0,2]函数,可以看出它的前半部分已经计算完,只需要计算后半部分,即第二个sort,然后再次merge,再sort[0,2]出栈。。。

如下为上个例子的归并排序的完整示例,sort 和 merge 的示意图,可以看到最后一次merge,正是上面说到的二路 [2,3,5] 和 [2,9] 的归并排序,如果不熟的,可以回过头再看看。

算法评价

归并排序的时间复杂度为O(nlogn) ,因为递归每次按照一半分区,并且merge需要线性时间。最重要的是该算法中最好、最坏和平均的时间性能都是O(nlogn)。

归并排序的空间复杂度为O(n),会占用内存。

总之,归并排序虽然比较占用内存,但却是一种效率高且稳定的算法。

总结

归并排序的时间复杂度,在最坏,最好和平均都是O(nlogn),这是效率,性能非常好的排序算法。

只不过它需要占用 O(n)的内存空间,如果数据量一旦很大,内存可能吃不消,这是它的弱点和致命伤。而其他排序算法,比如快速排序,希尔排序,都是就地排序算法,它们不占用额外的内存空间。

不过,这个占用内存的弱点,可以改进为就地排序,大家感兴趣,可以查看一下。


本文分享自微信公众号 - Python与机器学习算法频道(alg-channel),作者:zglg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 归并排序算法的过程图解

    主要推送关于对算法的思考以及应用的消息。坚信学会如何思考一个算法比单纯地掌握100个知识点重要100倍。本着严谨和准确的态度,目标是撰写实用和启发性的文章,欢迎...

    double
  • 不基于比较的基数排序原理图解

    主要推送关于对算法的思考以及应用的消息。坚信学会如何思考一个算法比单纯地掌握100个知识点重要100倍。本着严谨和准确的态度,目标是撰写实用和启发性的文章,欢迎...

    double
  • 学文科的他发明堆排序,逆袭成为斯坦福终身教授!

    计算机先驱奖获得者、斯坦福大学计算机科学系教授罗伯特·弗洛伊德(Robert W.Floyd)和威廉姆斯(J.Williams)在1964年共同发明了堆排序算法...

    double
  • 求两个有序数组合并后的中位数,最透讲解| 腾讯面试编程50题(三)

    本文是腾讯50道常考编程题之一:求解两个有序数组合并后的中位数,属于 "Hard" 难度,在校招中难倒一大波校招生。本文提供一种基本解法:基于归并排序。并对归并...

    不可言诉的深渊
  • 排序-归并排序,一种外排序,递归,非递归,磁盘?

    归并排序是一种分治思想的应用,所以也适合处理大数量的排序,因此也是一种外排序算法,磁盘排序算法,应用场景也较多,比如mysql的排序,sharding-jdbc...

    阿伟
  • 火星探测器安装AI软件,AEGIS 实现好奇号自主探索

    【新智元导读】去年 5 月,NASA 的工程师为火星探测器好奇号安装了一套 AI 软件 AEGIS,使得好奇号实现了从自动向自主的飞跃。上周,开发者在 Scie...

    新智元
  • MySQL实战 -- 可重复读 与 虚读

    CREATE TABLE `t` ( `id` int(11) NOT NULL, `c` int(11) DEFAULT NULL, ...

    MachineLP
  • 直播延时是如何产生的?4G摄像头无插件播放视频流媒体服务器EasyDSS超低延时直播的实现方案

    随着直播的越来越普及,我们作为用户,对直播的要求也越来越高,比如超低延时直播,且支持手机和PC端直接播放,不安装任何播放插件。那么问题来了,如何实现低延迟、秒开...

    EasyNVR
  • [未解决]yarn安装报错网络问题解决

    hankleo
  • ExtJs学习笔记(23)-ScriptTagProxy+XTemplate+WCF跨域取数据

    ajax应用中跨域一直是一个非常麻烦的问题,目前也有一些解决办法,但要么比较麻烦,要么就不具备通用性,幸好ExtJs里的ScriptTagProxy提供了跨域读...

    菩提树下的杨过

扫码关注云+社区

领取腾讯云代金券