前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >LeetCode 74 BAT经典面试题,在矩阵上做二分

LeetCode 74 BAT经典面试题,在矩阵上做二分

作者头像
TechFlow-承志
发布2020-06-03 11:11:44
5860
发布2020-06-03 11:11:44
举报
文章被收录于专栏:TechFlowTechFlow

今天是LeetCode专题43篇文章,我们今天来看一下LeetCode当中的74题,搜索二维矩阵,search 2D Matrix。

这题的官方难度是Medium,通过率是36%,和之前的题目不同,这题的点赞比非常高,1604个赞,154个反对。可见这题的质量还是很高的,事实上也的确如此,我就曾经在BAT的面试当中见过这道题。

题意

这题的题意也很简单,给定一个二维的数组matrix和一个整数target,这个数组当中的每一行和每一列都是递增的,并且还满足每一行的第一个元素大于上一行的最后一个元素。要求我们返回一个bool变量,代表这个target是否在数组当中。

也就是说这个是一个典型的判断元素存在的问题,我们下面来看看两个样例:

Input:
matrix = [
  [1,   3,  5,  7],
  [10, 11, 16, 20],
  [23, 30, 34, 50]
]
target = 3
Output: true
Input:
matrix = [
  [1,   3,  5,  7],
  [10, 11, 16, 20],
  [23, 30, 34, 50]
]
target = 13
Output: false

题解

这题刚拿到手可能会有些蒙,我们当然很容易可以看出来这是一个二分的问题,但是我们之前做的二分都是在一个一维的数组上,现在的数据是二维的,我们怎么二分呢?

我们仔细阅读一下题意,再观察一下样例,很容易发现,如果一个二维数组满足每一行和每一列都有序,并且保证每一行的第一个元素大于上一行的最后一个元素,那么如果我们把这个二维数组reshape到一维,它依然是有序的。

比如说有这样一个二维数组:

[[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]

它reshape成一维之后会变成这样:

[1, 2, 3, 4, 5, 6, 7, 8, 9]

reshape是numpy当中的说法,也可以简单理解成把每一行串在一起。所以这题最简单的做法就是把矩阵降维,变成一位的数组之后再通过二分法来判断元素是否存在。如果偷懒的话可以用numpy来reshape,如果不会numpy的话,可以看下我之前关于numpy的教程,也可以自己用循环来处理。

reshape之后就是简单的二分了,完全没有任何难度:

class Solution:
    def searchMatrix(self, matrix: List[List[int]], target: int) -> bool:
        import numpy as np
        arr = np.array(matrix)
        # 通过numpy可以直接reshape
        arr = arr.reshape((-1, ))
        l, r = 0, arr.shape[0]
        if r == 0:
            return False
        # 套用二分
        while l+1 < r:
            m = (l + r) >> 1
            if arr[m] <= target:
                l = m
            else:
                r = m
        return arr[l] == target

正经做法

引入numpy reshape只是给大家提供一个解决的思路,这显然不是一个很好的做法。那正确的方法应该是怎样的呢?

还是需要我们对问题进行深入分析,正向思考感觉好像没什么头绪,我们可以反向思考。这也是解题常用的套路,假设我们已经知道了target这个数字存在矩阵当中,并且它的行号是i,列号是j。那么根据题目当中的条件,我们能够得出什么结论呢?

我们分析一下元素的大小关系,可以得出行号小于i的所有元素都小于它,行号大于i的所有元素都大于它。同行的元素列号小于j的元素小于它,列号大于j的元素大于它。

也就是说,行号i就是一条隐形的分界线,将matrix分成了两个部分,i上面的小于target,i下方的大于target。所以我们能不能通过二分找到这个i呢?

想到这里就很简单了,我们可以通过每行的最后一个元素来找到i。对于一个二维数组而言,每行的最后一个元素连起来就是一个一维的数组,就可以很简单地进行二分了。

找到了行号i之后,我们再如法炮制,在i行当中进行二分来查找j的位置。找到了之后,再判断matrix[i][j]是否等于target,如果相等,那么说明元素在矩阵当中。

整个的思路应该很好理解,但是实现的时候有一个小小的问题,就是我们查找行的时候,找的是大于等于target的第一行的位置。也就是说我们查找的是右端点,那么二分的时候维护的是一个左开右闭的区间。在边界的处理上和平常使用的左闭右开的写法相反,注意了这点,就可以很顺利地实现算法了:

class Solution:
    def searchMatrix(self, matrix: List[List[int]], target: int) -> bool:
        n = len(matrix)
        if n == 0:
            return False
        
        m = len(matrix[0])
        if m == 0:
            return False
        
        # 初始化,左开右闭,所以设置成-1, n-1
        l, r = -1, n-1
        
        while l+1 < r:
            mid = (l + r) >> 1
            # 小于target的时候移动左边界
            if matrix[mid][m-1] < target:
                l = mid
            else:
                r = mid
                
        row = r
        
        # 正常的左闭右开的二分
        l, r = 0, m
        
        while l+1 < r:
            mid = (l + r) >> 1
            if matrix[row][mid] <= target:
                l = mid
            else:
                r = mid
                
        return matrix[row][l] == target

我们用了两次二分,查找到了结果,每一次二分都是一个O(logN)的算法,所以整体也是log级的算法。

优化

上面的算法没有问题,但是我们进行了两次二分,感觉有些麻烦,能不能减少一次,只使用一次二分呢?

如果想要只使用一次二分就找到答案,也就是说我们能找到某个方法来切分整个数组,并且切分出来的数组也存在大小关系。这个条件是使用二分的基础,必须要满足。

我们很容易在数组当中找到这样的切分属性,就是元素的位置。在矩阵元素的问题当中,我们经常用到的一种方法就是对矩阵当中的元素进行编号。比如说一个点处于i行j列,那么它的编号就是i * m + j,这里的m是每行的元素个数。这个编号其实就是将二维数组压缩到一维之后元素的下标。

我们可以直接对这个编号进行二分,编号的取值范围是确定的,是[0, mn)。我们有了编号之后,可以还原出它的行号和列号。而且根据题目中的信息,我们可以确定这个矩阵当中的元素按照编号也存在递增顺序。所以我们可以大胆地使用二分了:

class Solution:
    def searchMatrix(self, matrix: List[List[int]], target: int) -> bool:
        n = len(matrix)
        if n == 0:
            return False
        
        m = len(matrix[0])
        if m == 0:
            return False
        
        l, r = 0, m*n
        
        while l+1 < r:
            mid = (l + r) >> 1
            # 还原行号和列号
            x, y = mid // m, mid % m
            if matrix[x][y] <= target:
                l = mid
            else:
                r = mid
        return matrix[l // m][l % m] == target

这样一来我们的代码大大简化,并且代码运行的效率也提升了,要比使用两次二分的方法更快。

总结

这道题到这里就结束了,这题难度并不大,想出答案来还是不难的。但是如果在面试当中碰到,想要第一时间想到最优解法还是不太容易。这一方面需要我们积累经验,看到题目大概有一个猜测应该使用什么类型的算法,另一方面也需要我们对问题有足够的理解和分析,从而读到题目当中的隐藏信息

关于这题还有一个变种,就是去掉其中每行的第一个元素大于上一行最后一个元素的限制。那么矩阵当中元素按照编号顺序递增的性质就不存在了,对于这样的情况, 我们该怎么样运用二分呢?这个问题是LeetCode的240题,感兴趣的话可以去试着做一下这题,看看究竟解法有多大的变化。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Coder梁 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 题意
  • 题解
  • 正经做法
  • 优化
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档