生成器表达式与列表?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (8)
  • 关注 (0)
  • 查看 (58)

Python种什么时候应该使用生成器表达式,什么时候应该使用列表?

# Generator expression
(x*2 for x in range(256))

# List comprehension
[x*2 for x in range(256)]
提问于
用户回答回答于

重要的一点是,列表创建了一个新的列表。迭代器创建一个可迭代的对象,当您使用这些位时,它将“过滤”源文件。

假设您有一个名为“hugefile.txt”的2TB日志文件,您需要以单词“entry”开头的所有行的内容和长度。

可以写一个列表:

logfile = open("hugefile.txt","r")
entry_lines = [(line,len(line)) for line in logfile if line.startswith("ENTRY")]

这会删除整个文件,处理每一行,并将匹配的行存储在数组中。因此,这个数组可以包含最多2TB的内容。将会占用大量的RAM。

因此,我们可以使用生成器对内容应用“筛选器”。在我们开始对结果进行迭代之前,不会读取任何数据。

logfile = open("hugefile.txt","r")
entry_lines = ((line,len(line)) for line in logfile if line.startswith("ENTRY"))

我们想进一步过滤我们的结果:

long_entries = ((line,length) for (line,length) in entry_lines if length > 80)

仍然不读到任何内容,但是我们现在指定了两个生成器,它们将根据我们的意愿对我们的数据进行操作。

让我们把过滤过的行写到另一个文件中:

outfile = open("filtered.txt","a")
for entry,length in long_entries:
    outfile.write(entry)

现在我们读取输入文件。作为我们for 循环需要的内容。long_entries生成器要求从entry_lines 返回这行的长度,如果长度大于80字符,则筛选出来, 最后使用 entry_lines生成器请求行(按指示进行筛选)。logfile迭代器,依次读取文件。

因此,与其将数据“推”到输出函数,而是以一个完全填充的列表的形式,您将提供输出函数一种只在需要时“拉”数据的方法。这在我们的例子中更有效,但不那么灵活。发电机是单向的;我们读过的日志文件中的数据会立即被丢弃,因此我们不能回到前面的一行。另一方面,数据一旦处理完就会保存。

热门问答

对象存储COS有没有日志功能?

Hyman Wang

腾讯云 · 高级产品经理 (已认证)

推荐已采纳

你的cos 是否开通了 CDN 加速,如果开通了CDN 加速,可以去 CDN 的控制台下: (统计分析 --- 监控 )页面下拉到底部,可以通过 URL 查看流量情况。

对象存储里的视频能在线播放么?

Jinqn

腾讯 · 高级工程师 (已认证)

腾讯云COS前端开发
推荐

购买的云数据库里面有什么类型的数据库?有SQLserver吗?可以自己安装SQLserver吗?

帅的惊动我国计算机大神
推荐已采纳
云关系型数据库让您在云中轻松部署、管理和扩展的关系型数据库,提供安全可靠、伸缩灵活的按需云数据库服务。腾讯云关系型数据库提供 MySQL、SQL Server、MariaDB、PostgreSQL 数据库引擎,并针对数据库引擎的性能进行了优化。云关系型数据库是一种高度可用的托管服...... 展开详请

linux如何限制单一ip对服务器的日访问量?

小爱同学

腾讯云 · 技术支持 (已认证)

推荐
您根据当前网站规模和业务了解下【网站管家 WAF】,企业站点可有效抵御恶意攻击,垃圾访问。 图片.png 您反馈网站短信验证码被盗刷,也可结合自己业务,可自行部署iptables进行手动拦截。或其他方式 例如您的网站是nginx,在web配置文件中开启配置HttpLimitR...... 展开详请

兼容性测试只能上传apk测试的吗?

WeTest质量开放平台团队专注游戏,提升品质
推荐

目前不支持公众号的兼容测试,还请知晓

关于群自动解散的问题?

安稳

腾讯科技 · 工单技术支持 (已认证)

推荐
您好,临时群是没有的。云通信的群组只有私有群(Private)、公开群(Public)、聊天室(ChatRoom)、音视频聊天室(AVChatRoom)和在线成员广播大群(BChatRoom)这五种。 您说的这个需求,思路:创建群组时,服务端记录一下时间,到达约定解散的时间以后,...... 展开详请

所属标签

扫码关注云+社区