前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python重要知识,生成器的威力

Python重要知识,生成器的威力

作者头像
咋咋
发布2021-09-01 14:19:26
3360
发布2021-09-01 14:19:26
举报
文章被收录于专栏:数据大宇宙

前言

你熟悉 Python 中的 yield 关键字吗?

你知道列表推导式与生成器推导式的区别吗?

它们有什么使用场景?

假设有以下文本文件:

  • 我们需要找到那些"目标" 开头的行

你会怎么做?

一次把所有行读取下来,然后遍历过滤?

如果文件有100万行呢?


同时输出多个内容

如果我们把文件看作是一个仓库,里面每一行是货物。

你是零售商,此时有消费者找你买东西(那些"目标"开头的货物)

你有两种方式。

方式1:

  • 行5:你从仓库中把所有的货物搬到自己家里
  • 行7-11:然后一份份过滤,找到那两件货物

辛不辛苦不知道,但是占空间是肯定,应该没有谁会这么干吧

方式2:

  • 行4-10:你本人走到仓库里,逐一判断扣下符合条件的货物

此时解决了占家里空间的问题,但是你需要亲自跑到仓库做事情(代码表现是你的判断逻辑全混合到读取文件逻辑中)

有没有改进空间?


逻辑转移

关键问题是:

  • 红色框是取货逻辑,能不能移出来?

很简单:

  • 行8:遍历过程中,都会调用一次 行15 我们提供的判断逻辑

但是,这方式代码实在不直观,特别对比方式1:

  • 读取文件逻辑和取数判断逻辑完全分开

如果可以这样子就完美了:

  • 注意,不能把所有的获取一次性加载进来

数据生成器

其实,在上一种方式上简单修改即可:

  • 重点:不需要定义列表
  • 行6:直接返回货物,但是不用 return ,而是用 yield

此时,如果我们简单调用这个函数,会得到什么?

  • 这啥玩意

此时,这个函数叫做生成器(generator)。

注意,此时他根本不会加载数据,也就是说,这个函数里面的代码根本没有执行

它就像仓库管理员,现在你不需要亲自走进仓库里面:

  • 行3:这里做了2件事情,1是你打电话通知仓库管理员准备。2是开始问他逐一拿出货物
  • 行4:你逐一筛选货物

这里重点是叫他准备一次,他只能遍历一次:

  • 行1:做准备
  • 行5:使用了之前的准备
  • 行11:无法再用,此时 encore 啥也没有

优点:

  1. 省了空间,整个过程中没有一次性把所有数据加载进来
  2. 加载数据与处理数据的逻辑代码独立开来
  3. 代码实际上比"逻辑转移"的方式要多了一些,但是现在我们用遍历代码表达,语义更加直观清晰

需求升级一下:

在之前需求基础下,把目标数值大于95的货物取出来

想象一下,目标数量可能是200万,上面的代码行1变量 res 是一个列表,但数值大于95的可能只有几行。

我们好像又遇到了之前的空间问题


生成器推导式

上一种方式得到的是列表,是因为我们使用了列表推导式,我们只需要简单把最外层的方括号改为括号,推导式就会变成生成器:

  • 行1 与 行5:使用括号,这是生成器推导式,并不会真正加载数据。所以不管数据有多少,这一句代码都会瞬间执行完毕

这里用到解包,可以回看以前的解包教学视频:


你学会了没有?

记得点赞,转发!谢谢支持!

推荐阅读:

  1. Python进阶系列:Python遍历的秘密
  2. 字典推导式与解包
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据大宇宙 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 同时输出多个内容
  • 逻辑转移
  • 数据生成器
  • 生成器推导式
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档