写下这个题目的时候,脑海里无法抑制地响起了周华健那略带沙哑的歌声:
远处传来那首熟悉的歌,
那些心声为何那样微弱。
很久不见,你现在都还好吗?…
文末有作业
音乐结束,回到正题。近日浏览LeetCode,发现了一道很有意思的小题目。当我尝试用Python解答的时候,居然动用了集合、map函数、zip函数、lambda函数、sorted函数,调试过程还涉及到了迭代器、生成器、列表推导式的概念。一个看似极为简单的题目,尽管最终的代码可以合并成一行,却几乎把Python的编程技巧用了一遍,真可谓“细微之处见精神”!通过这个题目,也许会让你从此真正理解了Python编程。
这道题,名为《列表中的幸运数》。什么是幸运数呢?在整数列表中,如果一个数字的出现频次和它的数值大小相等,我们就称这个数字为「幸运数」。例如,在列表[1, 2, 2, 3]中,数字1和数字2出现的次数分别是1和2,所以它们是幸运数,但3只出现过1次,3不是幸运数。
明白了幸运数的概念,我们就来试着找出列表[3, 5, 2, 7, 3, 1, 2 ,4, 8, 9, 3]中的幸运数吧。这个过程可以分为以下几个步骤:
找出列表中不重复的数字
统计每个数字在列表中出现的次数
找出出现次数等于数字本身的那些数字
第1步,找出列表中不重复的数字
找出列表中不重复的数字,也就是去除列表中的重复元素,简称“去重”。去重最简洁的方法是使用集合。
1>>> arr = [3,5,2,7,3,8,1,2,4,8,9,3]
2>>> unique = set(arr)
3>>> unique
4{1, 2, 3, 4, 5, 7, 8, 9}
第2步,统计每个数字在列表中出现的次数
我们知道,列表对象自带一个count()方法,能返回某个元素在列表中出现的次数,具体用法如下:
1>>> arr = [3,5,2,7,3,8,1,2,4,8,9,3]
2>>> arr.count(8) # 元素8在数组arr中出现过2次
32
接下来,我们只需要遍历去重后的各个元素,逐一统计它们各自出现的次数,并保存成一个合适的数据结构,这一步工作就万事大吉了。
1>>> arr = [3,5,2,7,3,8,1,2,4,8,9,3]
2>>> unique = set(arr) # 去除重复元素
3>>> pairs = list() # 空列表,用于保存数组元素和出现次数组成的元组
4>>> for i in unique:
5 pairs.append((i, arr.count(i)))
6
7>>> pairs
8[(1, 1), (2, 2), (3, 3), (4, 1), (5, 1), (7, 1), (8, 2), (9, 1)]
作为新手,代码写成这样,已经很不错了。但是,一个有追求的程序员绝对不会就此自满、裹足不前。他们最喜欢做的事情就是想尽千方百计消灭for循环,比如使用映射函数、过滤函数取代for循环;即便不能拒绝for循环,他们也会尽可能把循环藏起来,比如藏在列表推导式内。这里既然是要对每一个元素都调用列表的count()这个方法,那就最适合用map函数取代for循环了。
1>>> m = map(arr.count, unique)
2>>> m
3
4>>> list(m) # 生成器可以转成列表
5[1, 2, 3, 1, 1, 1, 2, 1]
6>>> list(m) # 生成器只能用一次,用过之后,就自动清理了
7[]
map函数返回的是一个生成器(generator),可以像列表一样遍历,但无法像列表那样直观地看到各个元素,除非我们用list()把这个生成器转成列表(实际上并不需要将生成器转为列表)。请注意,生成器和迭代器不同,或者说生成器是一种特殊的迭代器,只能被遍历一次,遍历结束,就自动消失了。迭代器则可以反复遍历。比如,range()函数返回的就是迭代器:
1>>> a = range(5)
2>>> list(a)
3[0, 1, 2, 3, 4]
4>>> list(a)
5[0, 1, 2, 3, 4]
说完生成器和迭代器,咱们还得回到原来的话题上。使用map映射函数,我们得到了每个元素的出现次数,还需要和对应的元素组成一个一个的元组。这时候,就用上zip()函数了。zip() 函数创建一个生成器,用来聚合每个可迭代对象(迭代器、生成器、列表、元组、集合、字符串等)的元素,元素按照相同下标聚合,长度不同则忽略大于最短迭代对象长度的元素。
1>>> m = map(arr.count, unique)
2>>> z = zip(unique, m)
3>>> z
4
5>>> list(z)
6[(1, 1), (2, 2), (3, 3), (4, 1), (5, 1), (7, 1), (8, 2), (9, 1)]
7>>> list(z)
8[]
很显然,zip()函数返回的也是生成器,只能用一次,过后即消失。
第3步,找出出现次数等于数字本身的那些数字
有了每个元素及其出现的次数,我们只需要循环遍历……不,请稍等,我们为什么一定要循环呢?我们只是要把每个元素过滤一遍,找出那些出现次数等于元素自身的那些元组,为什么不试试过滤函数filter()呢?
1>>> def func(x): # 参数x是元组类型
2 if x[0] == x[1]:
3 return x
4
5>>> m = map(arr.count, unique)
6>>> z = zip(unique, m)
7>>> f = filter(func, z)
8>>> f
9
10>>> list(f)
11[(1, 1), (2, 2), (3, 3)]
12>>> list(f)
13[]
过滤函数filter()接受两个参数,第1个参数是个函数,用于判断一个元素是否符合过滤条件,第2个参数就是需要过滤的可迭代对象了。filter()函数返回的也是生成器,只能用一次,过后即消失。
写这里,我们几乎要大功告成了。但是,作为一个有追求的程序员,你能容忍func()这样一个看起来怪怪的函数吗?答案是不能!你一定会用lambda函数取代它。另外,也许我们还需要对结果按照元素的大小排序。加上排序,完整代码如下:
1>>> arr = [3,5,2,7,3,8,1,2,4,8,9,3]
2>>> unique = set(arr)
3>>> m = map(arr.count, unique)
4>>> z = zip(unique, m)
5>>> f = filter(lambda x:x[0]==x[1], z)
6>>> s = sorted(f, key=lambda x:x[0])
7>>> print('幸运数是:', [item[0] for item in s])
8幸运数是: [1, 2, 3]
终极代码,一行搞定
如果你曾经有过被那些写成一行、却能实现复杂功能的、看起来像天书一样的代码蹂躏的痛苦经历,那么,现在你也可以把上面的代码写成一行,去蹂躏别人了。
1>>> arr = [3,5,2,7,3,8,1,2,4,8,9,3]
2>>> print('幸运数是:', [item[0] for item in sorted(filter(lambda x:x[0]==x[1], zip(set(arr), map(arr.count, set(arr)))), key=lambda x:x[0])])
3幸运数是: [1, 2, 3]
作业
此作业是建立在本文内容上而布置:由文首可知,我们给出的集合是固定的,所以,能不能考虑每次运行的时候,集合内的数字不一样?此难度不大,只是为了让初学者更好的认识Python。再进行此练习的时候,将会用到:random 模块。
往期精彩链接
Windows下安装Scrapy方法及常见安装问题总结——Scrapy安装教程
CoXie资料大放送!程序员必备,看看你少了什么。
领取专属 10元无门槛券
私享最新 技术干货