前言:师妹前段时间非常认真地选了下学期的《大数据分析实践》选修课,根据几位师兄的建议买了本书开始自学 Python 语言。然而年后再见,师妹说她看完了书,做了一些习题,但并不觉得 Python 有啥吸引人的地方,对这门语言的激情也就大不如前。
起初笔者很疑惑为什么师妹会有这样的感受,直到看到了师妹写的 Python 代码,才明白了症结所在——师妹一直在用类似 C/C++ 语言的习惯写 Python 代码,而没有利用 Python 语言本身的特性,写的代码和以前的代码差不多冗长,开发效率并没有明显提高。因此自然不觉得 Python 有啥特别之处,也就失去了兴趣。
笔者指出了问题,接着对着师妹的代码,刷刷刷改了起来。不一会儿就将原代码量缩短了几乎一半。看着简洁、直观、自带注释属性的新代码,师妹重新燃起了学习的热情。在她的要求下,笔者整理了如下的15条经验,供大家参考和学习。
文章全文约2000字,共有15个程序样例片段。
测试环境为:python版本 3.7.0 / 操作系统window 7 64位;
Python 环境下,在开始编码之前,输入 importthis
,可以看到 Python 为我们准备的彩蛋——
The Zen of Python, by Tim Peters
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
......
部分内容简单翻译为:
优美胜于丑陋
明了胜于晦涩
简洁胜于复杂
……
可读性很重要
这就是著名的“Python之禅“。这几句内置的最正确的“废话“,体现了 Python 语言对于简洁与优美的追求。
在 Python 社区,程序员还创造了一个新词 Pythonic 来评价代码是否符合 Python 风格,并以写出 Pythonic 风格的代码而自豪。笔者初次看到这个单词时,首先想到的是日本鼎盛时期的代表企业,索尼和松下公司(Sony,Panasonic),进而联想起90年代这些公司极致、创新的产品和其所代表的精益求精的匠人精神。
扯远了,回到正题。笔者想表达的是,通过熟悉 Python 语言的一些基本特性,加以熟练应用,你也可以写出很 Pythonic 的代码!
话不多说,本文通过15个具体的例子,带你领略 Python 的简洁和优雅。
下文中'P'即表示'Pythonic',很 Python 的写法,'NP'也就是相反,不是很'Pythonic'的写法。
### NP:
a = 2
b = 5
c = 12
### P:
a,b,c = 2,5,12
a = 50
b = 25
### NP:
temp = a
a = b
b = temp
### P:
a,b = b,a
上面的例子通过了元组的pack和unpack完成了对a,b的互换,避免了使用临时变量temp,而且只用了一行代码。
a = 50
b = 25
### NP:
0<= b and b<=a and a<100
### P:
0 <= b <= a < 100
后者的写法更接近数学表达式。
any
和 all
是 Python
的内置函数。对于 any
函数,可迭代参数的任何一个元素为真就返回 True
,否则返回 False
。对于 all
函数,如果可迭代参数的所有元素为真(或迭代器为空),返回 True
,否则返回 False
。
### NP:
xyz = [4641951.185 1393053.923 4133281.067]
for v in xyz:
if 0.0==v:
return False
return True
### P:
return all(xyz)
同样是多重判断问题,判断某个变量是否为多个可能取值之一
### NP:
if 'green'==s0 or 'red'==s0 or 'blue'==s0:
return True
else:
return False
### P:
return s0 in ('green', 'red', 'blue')
### NP:
if age > 18:
ss = 'adult'
else:
ss = 'child'
### P:
ss = 'adult' if age > 18 else 'child'
后者的写法简单易懂,仅需一行代码就完成了常规写法4行代码的功能。
lst_str = ["Python", "is", "a", "good", "language"]
### NP1:
ss = ''
for s0 in lst_str:
ss += s0 + ' '
### NP2:
ss = '%s %s %s %s %s'%(lst_str[0], lst_str[1], lst_str[2], lst_str[3], lst_str[4])
### P:
ss = ' '.join(lst_str)
使用 join
方法可以指定间隔字符(串)将字符串列表合并成一个字符串。
fname1 = 'python.jpg'
fname2 = 'folwer.bmp'
fname3 = 'readme.txt'
### P:
fname1.startswith('python') #True
fname2.endswith('.jpg') #False
fname2.endswith(('.jpg', '.bmp')) #True
fname3.endswith(('.jpg', '.bmp')) #False
从列表中找出符合条件的元素组成新的列表
lst0 = [11, 22, 24, 87, 70]
### NP:
lst1 = []
for v in lst0:
if v>30:
lst1.append(v)
### P:
lst1 = [ v for v in lst0 if v>30 ]
可以结合上面两条tips,可以实现快速找出文件夹下指定类型的文件,例如:
picfiles = [nm for nm in os.listdir(mydir) if nm.endswith( ('.jpg', '.bmp', '.tiff', '.gif', '.png') ) ]
当想要对多个列表对应的元素进行操作时
income = [201, 198, 195, 210, 199]
cost_rent = [80, 83, 77, 81, 80]
cost_food = [47, 64, 53, 51, 79]
balance = []
### NP:
nlen = len(income)
for i in range(nlen):
balance.append(income[i] - cost_rent[i] - cost_food[i])
### P:
for i0, cr, cf in zip(income, cost_rent, cost_food):
balance.append(i0 - cr - cf)
zip(a,b)
会生成一个可返回元组 (x,y)
的迭代器,其中x来自a,y来自b。 一旦其中某个序列到底结尾,迭代宣告结束。 因此迭代长度跟参数中最短序列长度一致。
### NP:
lst_new = []
for v in lst_old:
if not v in lst_new:
lst_new.append(v)
### P:
lst_new = list(set(lst_old))
### NP:
fp = open('result.txt', 'w')
try:
fp.write('just for fun!')
except IOError:
print('something error')
finally:
fp.close()
### P:
with open('result.txt', 'w') as fp:
fp.write('just for fun!')
with 关键字实现了上下文管理器,是一种更简洁也更安全的操作方法。上例中当离开 with 代码块的时候,系统会自动调用 fp.close() 方法关闭文件, 哪怕中间遇到异常,close 方法也会被调用。
枚举函数,用于枚举可迭代对象,并且同时返回元素的下标索引值。
如果你想在迭代一个序列的同时,得到被处理元素的索引下标。内置的 enumerate()
函数可以很好的解决这个问题:
array = ['Stone', 'Tom', 'Jobs', 'Jack']
### NP:
narr = len(array)
for i in range(narr):
print (i, array[i])
### P:
for i, a0 in enumerate(array):
print (i, a0)
#0 Stone
#1 Tom
#2 Jobs
#3 Jack
有时,你想通过某种对齐方式来格式化字符串,输出一些提示信息
ss = 'Summary'
### NP:
print ('%s%s%s', '-'*20, ss, '-'*20)
### P:
print (ss.center(50,'-'))
#--------------------Summary--------------------
类似地,想让字符串左对齐或者右对齐,可以用 .ljust(50, '-') 或 rjust(50, '-')
解压列表/元祖的元素,赋值给不同的变量
lst = ['jack', 18, 'Python', 'Good']
### NP:
name = lst[0]
age = lst[1]
lang = lst[2]
score = lst[3]
### P:
name, age, lang, score = lst
如果想解包一个长列表,只得到其中部分元素,例如第一个和最后一个元素:
### P:
head, *mid, tail = lst
该例子中,除了头、尾元素之外,中间不受关注的元素作为一个子列表全部赋值给了 mid 。