彻底理解Iterable、Iterator、generator

Photo by Brooke Lark on Unsplash

1 Iterable

我们一般称 Iterable 可迭代对象。Python 中任意的对象,只要它定义了可以返回一个迭代器的 __iter__ 方法,或者定义了可以支持下标索引的 __getitem__ 方法,那么它就是一个可迭代对象。我们常用到的集合数据类型都是 Iterable。例如列表(list)、元组(tuple)、字典(dict)、集合(set)、字符串(str)等。

我定义了一个列表 numlist,打印出该列表的方法。

numlist = [1, 2, 3]
print(numlist)
print(numlist.__iter__)      # 调用__iter__方法
print(numlist.__getitem__)    # 调用__getitem__方法

运行结果如下:

根据运行结果,我们可知列表就是个可迭代对象。Python 的 collections 库有个 isinstance() 函数。可以用来判断一个对象是否是 Iterable 对象。

from collections import Iterable  

isinstance({}, Iterable)  
isinstance((), Iterable) 
isinstance(999, Iterable)

运行结果为:

如果我们每次都要使用这个函数来判断一个对象是否为可迭代对象,这样操作有点麻烦。有没有快速判定的方法呢?答案是肯定的。可以直接使用 for 循环进行遍历的对象就是可迭代对象。

除此之外,generator(生成器)带 yield 的 generator function 也是可迭代的对象。

2 Iterator

Iterator 是迭代器的意思。任意对象,只要定义了 next()(Python 2 版本)或者 __next__()(Python 3 版本) 方法,那么它就是一个迭代器。迭代器中还有另一个函数 __iter__(),它和 __next__() 方法形成迭代器协议。

  • iter()

返回主要是返回迭代器对象本身,即 return self 。如果你自己定义个迭代器,实现该函数就能使用 for ... in ... 语句遍历了。

  • next()

获取容器中的下一个元素,当没有可访问元素后,就抛出 StopIteration 异常。

遍历迭代器有两个方式。一种是使用 __next__() 函数;另一种则是使用 for each 循环,本质上就是通过不断调用 __next__() 函数实现的。

from collections import Iterator

numlist = [1, 2, 3]

# 将数组转化为迭代器
ite1 = iter(numlist)
print(ite1)

for i in ite1:
    print(i)

print("=========")

ite2 = iter(numlist)
while True:
    try:
        num = ite2.__next__()
        print(num)
    except StopIteration:
        break

值得注意的是一个 Iterator 只能遍历一次。

3 generator

generator 翻译成中文是生成器。生成器也是一种特殊迭代器。它其实是生成器函数返回生成器的迭代,“生成器的迭代器” 这个术语通常被称作”生成器”。yield 是生成器实现 __next__() 方法的关键。它作为生成器执行的暂停恢复点,可以对 yield 表达式进行赋值,也可以将 yield 表达式的值返回。任何包含 yield 语句的函数被称为生成器。

yield是一个语法糖,内部实现支持了迭代器协议,同时yield内部是一个状态机,维护着挂起和继续的状态。

个人认为,生成器算是 Python 非常棒的特性。它的出现能帮助大大节省些内存空间。假如我们要生成从 1 到 10 这 10 个数字,采用列表的方式定义,会占用 10 个地址空间。采用生成器,只会占用一个地址空间。因为生成器并没有把所有的值存在内存中,而是在运行时生成值。所以生成器只能访问一次。

创建一个从包含 1 到 10 的生成器的例子。

gen = (i for i in range(10))
print(gen)
for i in gen:
    print(i)

运行结果如下:

带有 yield 关键字 的例子。重点关注运行结果,这能让你对 yield 有更深的认识。

def testYield(n):
    for i in range(n):
        print("当前值: ", i)
        yield doubeNumber(i)
        print("第 ", i, " 次运行")
    print("testYield 运行结束")

def doubeNumber(i):
    return i*2
    
if __name__ == '__main__':
    for i in testYield(3):
        print(i, "===", i)

运行结果如下:

END

作者:猴哥

公众号:极客猴

爱好读书,喜欢钻研技术,梦想成为文艺青年的 boy。

原文发布于微信公众号 - 极客猴(Geek_monkey)

原文发表时间:2017-11-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IMWeb前端团队

标准的Promise

序言 不同项目下lib里的promise/deferred往往是差异化最多的,用起来和自己的习惯相比经常是缺胳膊少腿多屁眼有卵用,因此聊聊标准的Promise的...

20950
来自专栏老九学堂

最新Java高薪面试题+答案+解析!

今天老九君给大家分享一些Java面试需要的题目哟~ 01 anonymousinnerclass(匿名内部类)是否可以extends(继承)其它类,是否可以im...

46370
来自专栏个人随笔

房上的猫:类的无参方法

一.类的无参方法  1.概述:   (1)类是由一组具有相同属性和共同行为的实体抽象而来的   (2)对象执行的操作是通过编写类的方法实现的   (3)类的每一...

386130
来自专栏前端知识分享

第184天:js创建对象的几种方式总结

javascript 创建对象简单的来说,无非就是使用内置对象或各种自定义对象,当然还可以使用JSON,但写法有很多,也能混合使用。

12330
来自专栏python成长之路

引用传递函数值

11610
来自专栏Python爱好者

Java基础笔记07

12130
来自专栏技术/开源

一道javascript面试题

下面表达式比较的结果分别是什么? 1. []=="0" 2. []==0 3. "0"==0 4. []==false 5. []==[] 大家可以...

246100
来自专栏十月梦想

php内建函数

strpos(变量名,'包含字符')判断变量中字符首次出现的位置,返回值数字,第一位为0

14340
来自专栏小白的技术客栈

Python基础语法-常量与变量(重发)

昨天的文章虽然有插图,但是一个都没有显示出来,估计是天气太热,不愿意露面的缘故吧。这些都不是事,暂且不表,今天再次发布与昨天相同的文章,主要为了弥补3个插图。为...

38440
来自专栏Brian

C++11基础学习系列三

---- 概述 随着自己学习C++11的进度,今天记录和实战C++11的战果。废话少说,直接记录C++11的点滴。 数组 在前面学习系列里面,介绍了模板容器类v...

28740

扫码关注云+社区

领取腾讯云代金券