Python代码性能优化

Python使用非常方便、灵活,因此很受欢迎。但正因为如此,导致实现同一功能时,Python代码有很多写法,但不同的写法有不同的性能。因此写Python代码要有良好的习惯,多写高性能的代码。作者原来平常写Python代码也很随意,直到某天处理大量数据时半天看不到结果,究其原因,是Python代码的性能问题导致的。

1. 列表解析与列表重建

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import time

fr = open('words.txt')
t1 = time.time()
word_list = fr.readlines()
t2 = time.time()
print 'read file time: ', t2 -t1
fr.close()

# for循环构建列表
keywords = []
t1 = time.time()
for word in word_list:
    word = word.strip()
    keywords.append(word)
t2 = time.time()
print 'for loop time: ', t2 - t1

# 列表解析
t3 = time.time()
keywords = [word.strip() for word in word_list]
t4 = time.time()
print 'list pars time: ', t4 - t3

fr = open('words.txt')
t5 = time.time()
keywords = [word.strip() for word in fr.readlines()]
t6 = time.time()
fr.close()
print 'read file and list parse time: ', t6 - t5

print 'list length: ', len(word_list)

运行结果:

read file time:  0.0318450927734
for loop time:  0.137716054916
list pars time:  0.0910630226135
read file and list parse time:  0.124923944473
list length:  441669

结论:本次测试中,列表解析时间是for循环时间的2/3

2. 字符串拼接

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import time

fr = open('words.txt')
keywords = [word.strip() for word in fr.readlines()]
fr.close()

# 加号拼接字符串
t1 = time.time()
str1 = ''
for word in keywords:
    str1 += word
t2 = time.time()
print 'string concat time: ', t2 - t1

# join拼接字符串
t1 = time.time()
str2 = ''.join(keywords)
t2 = time.time()
print 'string join time: ', t2 - t1

print 'list length: ', len(keywords)

运行结果:

string concat time:  0.0814869403839
string join time:  0.0123951435089
list length:  441669

结论:本次测试中,join函数拼接字符串比+=拼接字符串快6倍多

3. range与xrange

  • range

python中range会直接生成一个list对象。

  • xrange

用法与range完全相同,所不同的是生成的不是一个数组,而是一个生成器,它的类型为xrange。在生成非常大的数字序列时,xrange不会马上开辟很大的一块内存空间。如果不是需要返回列表,则尽可能使用xrange

测试代码:

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import time

t1 = time.time()
for i in range(1000000):
    pass
t2 = time.time()
print 'range time: ', t2 -t1

t1 = time.time()
for i in xrange(1000000):
    pass
t2 = time.time()
print 'xrange time: ', t2 -t1

测试结果:

range time:  0.0680990219116
xrange time:  0.0329170227051

结论:本次测试中,xrangerange快一倍多。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据

在Python中什么时候用Yield什么时候用Return

许多Python开发人员在代码中使用yield,而不考虑他们是否真的需要。这篇文章解释了你什么时候应该使用它。

42300
来自专栏ml

C与C++在const用法上的区别

       首先,C和C++在大体结构上不同,却在语法上相同。  所以在使用的时候,我们会时常遇到一些莫名其妙的问题,觉得语法上是正确的,但是编译的时候却出现...

33240
来自专栏Python攻城狮

Python-time模块一、python time模块的简介 二、python time模块函数

注意:时间戳(timestamp)的方式:通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.tim...

11530
来自专栏微信公众号:Java团长

Java进阶02 异常处理

程序很难做到完美,不免有各种各样的异常。比如程序本身有bug,比如程序打印时打印机没有纸了,比如内存不足。为了解决这些异常,我们需要知道异常发生的原因。对于一些...

11010
来自专栏Redis源码学习系列

Redis源码学习之对象系统

在前面的文章中,我介绍了Redis的底层数据结构,但Redis对外提供的命令并没有直接使用它们,而是基于它们构建更高级的数据对象,总共包括5中对象类型,分别为【...

16730
来自专栏nummy

python拾遗【2】自定义异常类

13230
来自专栏深度学习与计算机视觉

时间复杂度的计算

如果我们想验证一段代码的效率,一个最直接的办法就是编出来之后运行一下,这个方法称为事后统计方法,但是这个方法存在着非常大的弊端,比如我们需要时间编写代码,而代码...

22080
来自专栏Vamei实验室

Java进阶02 异常处理

程序很难做到完美,不免有各种各样的异常。比如程序本身有bug,比如程序打印时打印机没有纸了,比如内存不足。为了解决这些异常,我们需要知道异常发生的原因。对于一些...

21970
来自专栏韩伟的专栏

框架设计原则和规范(三)

此文是《.NET:框架设计原则、规范》的读书笔记,本文内容较多,共分九章,将分4天进行推送,今天推送6-7章。 1. 什么是好的框架 2. 框架设计...

39660
来自专栏coding for love

JS入门难点解析8-作用域,作用域链,执行上下文,执行上下文栈等分析

(注1:如果有问题欢迎留言探讨,一起学习!转载请注明出处,喜欢可以点个赞哦!) (注2:更多内容请查看我的目录。)

13010

扫码关注云+社区

领取腾讯云代金券