1、问题背景
在考虑代码优化时,我很好奇在 Python 中哪种方式开销更大:
if x:
d = 1
else:
d = 2
还是
d = 2
if x:
d = 1
我想知道减少第二种方式中的行数是否比条件切换的成本更高。
2、解决方案
不要思考,不要猜测,而是去测量——使用 shell 命令行中的 timeit(这是迄今为止使用它的最佳且最简单的方式!)。以下是在 Mac OSX 10.5 上的 Python 2.5.4 笔记本电脑上的测量结果:
$ python -mtimeit -s'x=0' 'if x: d=1' 'else: d=2'
10000000 loops, best of 3: 0.0748 usec per loop
$ python -mtimeit -s'x=1' 'if x: d=1' 'else: d=2'
10000000 loops, best of 3: 0.0685 usec per loop
$ python -mtimeit -s'x=0' 'd=2' 'if x: d=1'
10000000 loops, best of 3: 0.0734 usec per loop
$ python -mtimeit -s'x=1' 'd=2' 'if x: d=1'
10000000 loops, best of 3: 0.101 usec per loop
从测量结果可以看出,当 x 为 false 时,“仅仅-if”形式可以节省 1.4 纳秒,但当 x 为 true 时,它的开销为 40.2 纳秒,而“if/else”形式的开销。因此,在微优化的背景下,只有当 x 是 false 的可能性是 true 的 30 倍或左右时,才应该使用前一种形式。此外,
$ python -mtimeit -s'x=0' 'd=1 if x else 2'
10000000 loops, best of 3: 0.0736 usec per loop
$ python -mtimeit -s'x=1' 'd=1 if x else 2'
10000000 loops, best of 3: 0.076 usec per loop
if/else 的三元运算符也有着细微的优缺点。
当差异如此微小时,你应该反复测量,建立噪声水平,并确保你没有将“噪声”中的差异视为显着差异。例如,要比较语句与表达式 if/else 在“x 为 true”的情况,请重复执行几次:
$ python -mtimeit -s'x=1' 'd=1 if x else 2'
10000000 loops, best of 3: 0.076 usec per loop
$ python -mtimeit -s'x=1' 'd=1 if x else 2'
10000000 loops, best of 3: 0.0749 usec per loop
$ python -mtimeit -s'x=1' 'd=1 if x else 2'
10000000 loops, best of 3: 0.0742 usec per loop
$ python -mtimeit -s'x=1' 'd=1 if x else 2'
10000000 loops, best of 3: 0.0749 usec per loop
$ python -mtimeit -s'x=1' 'd=1 if x else 2'
10000000 loops, best of 3: 0.0745 usec per loop
现在你可以说表达式形式在(这台机器和关键软件版本上)耗时 74.2 到 76.0 纳秒——这个范围比任何单个数字都要更有表达力。同样地:
$ python -mtimeit -s'x=1' 'if x: d=1' 'else: d=2'
10000000 loops, best of 3: 0.0688 usec per loop
$ python -mtimeit -s'x=1' 'if x: d=1' 'else: d=2'
10000000 loops, best of 3: 0.0681 usec per loop
$ python -mtimeit -s'x=1' 'if x: d=1' 'else: d=2'
10000000 loops, best of 3: 0.0687 usec per loop
$ python -mtimeit -s'x=1' 'if x: d=1' 'else: d=2'
10000000 loops, best of 3: 0.0679 usec per loop
$ python -mtimeit -s'x=1' 'if x: d=1' 'else: d=2'
10000000 loops, best of 3: 0.0692 usec per loop
现在你可以确信,在相同条件下,语句形式耗时 67.9 到 69.2 纳秒;因此,对于 x 为 true,它比表达式形式的优势是 4.8 到 8.1 纳秒(将后一区间估计限制为 6.3 到 6.8 纳秒是公平的,比较最小值/最小值和最大值/最大值,而不是最小值/最大值和最大值/最小值作为更宽泛、更谨慎的估计)。
一旦你意识到这些差异是微观差异,你愿意花多少时间和精力来处理这些微观差异当然是一个不同的问题。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。