客官,来嘛,谷歌小菜请你尝尝!

作者:柳行刚

编辑:王抒伟

谷歌面试题

等你来挑战

详情往下看

各位,看招

1

题目描述:

一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间

2

题目分析

翻译一下就是:

描述:有一行N个数,这些数都比N小,而且有重复。

要求:让你找到重复的数,满足“O(1)空间和O(n)时间”。

有人可能不理解空间复杂度和时间复杂度

时间复杂度:执行算法所需要的计算工作量

空间复杂度:执行这个算法所需要的内存空间

如果你看到这里可以以迅雷不及掩耳的速度得到解决办法,那么你就离谷歌。。。还很远。

然而这里有大神可以以两种办法解决,请看VCR

3

解法一:

条件1:要求用O(n)的时间复杂度,这意味着只能遍历数组一次。

同时还要寻找重复元素,很容易想到建立哈希表来完成。

完成办法:遍历数组时将每个元素映射到哈希表中,如果哈希表中已经存在这个元素则说明这就是个重复元素

因此直接使用C++ STL中的hash_set(参见《STL系列之六 set与hash_set》)可以方便的在O(n)时间内完成对重复元素的查找。

但是:要求O(1)的空间空间复杂度,因此采用哈希表这种解法肯定在空间复杂度上是不符合要求的。

但可以沿着哈希法的思路继续思考,题目中数组中所以数字都在范围[0, n-1],因此哈希表的大小为n即可。

因此我们实际要做的就是对n个范围为0到n-1的数进行哈希,而哈希表的大小刚好为n。

对排序算法比较熟悉的同学不难发现这与一种经典的排序算法——基数排序非常类似。

而基数排序的时间空间复杂度刚好符合题目要求!

因此尝试使用基数排序来解这道面试题

4

例子详解

下面以2,4,1,5,7,6,1,9,0,2这十个数为例,展示下如何用基数排序来查找重复元素

下标

0

1

2

3

4

5

6

7

8

9

数据

2

4

1

5

7

6

1

9

0

2

(1)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2]得:

下标

0

1

2

3

4

5

6

7

8

9

数据

1

4

2

5

7

6

1

9

0

2

(2)由于第0个元素a[0] 等于1不为0,故交换a[0]与a[a[0]]即交换a[0]与a[1]得:

下标

0

1

2

3

4

5

6

7

8

9

数据

4

1

2

5

7

6

1

9

0

2

(3)由于第0个元素a[0] 等于4不为0,故交换a[0]与a[a[0]]即交换a[0]与a[4]得:

下标

0

1

2

3

4

5

6

7

8

9

数据

7

1

2

5

4

6

1

9

0

2

(4)由于第0个元素a[0] 等于7不为0,故交换a[0]与a[a[0]]即交换a[0]与a[7]得:

下标

0

1

2

3

4

5

6

7

8

9

数据

9

1

2

5

4

6

1

7

0

2

(5)由于第0个元素a[0] 等于9不为0,故交换a[0]与a[a[0]]即交换a[0]与a[9]得:

下标

0

1

2

3

4

5

6

7

8

9

数据

2

1

2

5

4

6

1

7

0

9

(6)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2],但a[2]也为2与a[0]相等,因此我们就找到了一个重复的元素——2

下标

0

1

2

3

4

5

6

7

8

9

数据

2

1

2

5

4

6

1

7

0

9

有了上面的分析,代码不难写出:

具体实现代码(C++)

5

解法二:

数组中数据范围为[0,n-1],因此可以通过判断元素是否大于0来决定这个元素是未访问过的数据还是已访问过的数据

通过加n。这样通过判断元素是否大于等于n就能决定这个元素是未访问过的数据还是已访问过的数据。

完整代码如下:

具体实现代码(C++)

原文发布于微信公众号 - 机器学习算法全栈工程师(Jeemy110)

原文发表时间:2017-09-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏青青天空树

小白初理解树状数组

  ACM的在线测试里经常涉及到大量数据的的修改,求和等操作,这里介绍一种方法——树状数组。

622
来自专栏闻道于事

Oracle数据库 拾漏补缺

select语句的基本使用 可以查询需要的列,行,可以进行多表链接,连接查询。 ? select e.*,e.sal/30 from p_emp e selec...

3188
来自专栏mathor

TRIE(2)

 其中MAX_NODE是trie中最大能存储的节点数目,CHARSET是字符集的大小,k是当前trie中包含有多少个节点。Triei的值是0表示trie树中i号...

1053
来自专栏desperate633

浅谈javascript中的回调函数javascript中的函数匿名函数回调函数回调函数的使用回调函数实例总结

要理解javascript中的回调函数,首先我们就要对javascript中的函数有一定的理解,所以我们先从javascript中函数谈起,讲讲它与其他语言中的...

622
来自专栏软件开发 -- 分享 互助 成长

二维数组简介与使用

前言 本文将探讨一下关于二维数组在内存中的存储和二维数组在参数传递时的使用。 一、二维数组在内存中的存储 如果定义一个这样的二维数组int a[3][4]={{...

18210
来自专栏海天一树

小朋友学C语言(23):二进制与十进制之间的转换

在学本节之前,请先复习 小朋友学C语言(17):二进制 一、二进制转换为十进制的C语言代码 #include <stdio.h> #include <strin...

2615
来自专栏Pythonista

Golang之fmt格式“占位符”

773
来自专栏专注数据中心高性能网络技术研发

HERD--GCC宏

减少跳转语句失效时CPU等待取指令时间,提高CPU效率 使用__builtin_expect(EXP,N) 意思是EXP==N的概率很大 一般封装为LIKELY...

2725
来自专栏Java帮帮-微信公众号-技术文章全总结

Java基础-Java基础-02总结关键字,标识符,注释,常量进制,变量数据类型

首先原谅小编的过错,昨天第二篇文章标题是: 程序员:为什么选择Java? ? 1:关键字(掌握) (1)被Java语言赋予特定含义的单词 (2)特点: 全...

2315
来自专栏锦小年的博客

python学习笔记2.3- 循环、判断

会了print()以后就可以开始基础编程,首先要学会怎么表达循环和条件判断,这是程序中用来表达逻辑的语法。python中的循环关键字有:for 和 while...

16810

扫码关注云+社区