Python代码性能优化

Python使用非常方便、灵活,因此很受欢迎。但正因为如此,导致实现同一功能时,Python代码有很多写法,但不同的写法有不同的性能。因此写Python代码要有良好的习惯,多写高性能的代码。作者原来平常写Python代码也很随意,直到某天处理大量数据时半天看不到结果,究其原因,是Python代码的性能问题导致的。

1. 列表解析与列表重建

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import time

fr = open('words.txt')
t1 = time.time()
word_list = fr.readlines()
t2 = time.time()
print 'read file time: ', t2 -t1
fr.close()

# for循环构建列表
keywords = []
t1 = time.time()
for word in word_list:
    word = word.strip()
    keywords.append(word)
t2 = time.time()
print 'for loop time: ', t2 - t1

# 列表解析
t3 = time.time()
keywords = [word.strip() for word in word_list]
t4 = time.time()
print 'list pars time: ', t4 - t3

fr = open('words.txt')
t5 = time.time()
keywords = [word.strip() for word in fr.readlines()]
t6 = time.time()
fr.close()
print 'read file and list parse time: ', t6 - t5

print 'list length: ', len(word_list)

运行结果:

read file time:  0.0318450927734
for loop time:  0.137716054916
list pars time:  0.0910630226135
read file and list parse time:  0.124923944473
list length:  441669

结论:本次测试中,列表解析时间是for循环时间的2/3

2. 字符串拼接

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import time

fr = open('words.txt')
keywords = [word.strip() for word in fr.readlines()]
fr.close()

# 加号拼接字符串
t1 = time.time()
str1 = ''
for word in keywords:
    str1 += word
t2 = time.time()
print 'string concat time: ', t2 - t1

# join拼接字符串
t1 = time.time()
str2 = ''.join(keywords)
t2 = time.time()
print 'string join time: ', t2 - t1

print 'list length: ', len(keywords)

运行结果:

string concat time:  0.0814869403839
string join time:  0.0123951435089
list length:  441669

结论:本次测试中,join函数拼接字符串比+=拼接字符串快6倍多

3. range与xrange

  • range

python中range会直接生成一个list对象。

  • xrange

用法与range完全相同,所不同的是生成的不是一个数组,而是一个生成器,它的类型为xrange。在生成非常大的数字序列时,xrange不会马上开辟很大的一块内存空间。如果不是需要返回列表,则尽可能使用xrange

测试代码:

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import time

t1 = time.time()
for i in range(1000000):
    pass
t2 = time.time()
print 'range time: ', t2 -t1

t1 = time.time()
for i in xrange(1000000):
    pass
t2 = time.time()
print 'xrange time: ', t2 -t1

测试结果:

range time:  0.0680990219116
xrange time:  0.0329170227051

结论:本次测试中,xrangerange快一倍多。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Script Boy (CN-SIMO)

Codeforces Round #234A

Inna and choose option     题意: 一个由12个字符('O'或'X')组成的字符串,这12个字符可以排列成a*b(a*b=12)的...

2110
来自专栏ytkah

怎么采集dedecms自定义内容模型

  有时我们需要用到dedecms提供的自定义内容模型功能去添加自定义内容模型来满足需求,那么dedecms自定义内同模型怎么添加采集规则呢?打开“/dede/...

2686
来自专栏一“技”之长

分分钟使用正则表达式 原

        从概念上来说,正则表达式也是一门小巧而精炼的语言,它可以用来简化检索特定的字符串,替换特定字符等功能,有许多开发语言工具,都内嵌支持正则表达式。...

603
来自专栏Hongten

对"for循环中尽量减少对变量的重复计算"提出质疑

===========================================================

651
来自专栏Golang语言社区

Golang 语言--map 用range遍历不能保证顺序输出

按照之前我对map的理解,map中的数据应该是有序二叉树的存储顺序,正常的遍历也应该是有序的遍历和输出,但实际试了一下,却发现并非如此,网上查了下,发现从Go1...

4008
来自专栏开发技术

排序之简单选择排序

  本篇博客是在伍迷兄的博客基础上进行的,其博客地址点击就可以进去,里面好博客很多,我的排序算法都来自于此;一些数据结构方面的概念我就不多阐述了,伍迷兄的博客中...

842
来自专栏深度学习之tensorflow实战篇

python中list、array、matrix之间的基本区别

python科学计算包的基础是numpy, 里面的array类型经常遇到. 一开始可能把这个array和python内建的列表(list)混淆, 这里简单总结一...

52612
来自专栏听雨堂

数据绑定应当注意的一个白痴问题

就是在页面中绑定时,假如被绑定的内容要写到双引号之中时,有时会报错。 <%#DataBinder.Eval(Container.DataItem, "FName...

19010
来自专栏数据结构与算法

20:删除单词后缀

20:删除单词后缀 总时间限制: 1000ms 内存限制: 65536kB描述 给定一个单词,如果该单词以er、ly或者ing后缀结尾, 则删除该后缀(题目保...

3434
来自专栏算法channel

直接选择排序到堆排序做的那些改进

主要推送关于对算法的思考以及应用的消息。坚信学会如何思考一个算法比单纯地掌握100个知识点重要100倍。本着严谨和准确的态度,目标是撰写实用和启发性的文章,欢迎...

2747

扫码关注云+社区