迭代器协议
迭代器
生成器
生成器函数
生成器表达式
Python中 list,truple,str,dict这些都可以被迭代,但他们并不是迭代器。为什么?
因为和迭代器相比有一个很大的不同,list/truple/map/dict这些数据的大小是确定的,也就是说有多少事可知的。但迭代器不是,迭代器不知道要执行多少次,所以可以理解为不知道有多少个元素,每调用一次next(),就会往下走一步,是惰性的。
from collections.abc import Iterable,Iterator
a = [1,2,]
print(isinstance(a,Iterable)) #True list是可迭代的
print(isinstance(a,Iterator)) #False list不是迭代器
通过iter()方法,获取iterator对象
from collections.abc import Iterable,Iterator
a = [1,2,]
iter_rator = iter(a)
print(isinstance(a,Iterable)) #True 可迭代的
print(isinstance(iter_rator,Iterator)) # True 迭代器
print(isinstance((x for x in range(10)),Iterator)) #True
# 总结
# 凡是可以for循环的,都是Iterable
# 凡是可以next()的,都是Iterator
# list,truple,dict,str,都是Itrable不是Iterator,但可以通过iter()函数获得一个Iterator对象
class Iterable(metaclass=ABCMeta):
__slots__ = ()
@abstractmethod
def __iter__(self):
while False:
yield None
@classmethod
def __subclasshook__(cls, C):
if cls is Iterable:
return _check_methods(C, "__iter__")
return NotImplemented
通过自定义一个迭代器,进一步说明什么是迭代器,什么是可迭代对象
from collections.abc import Iterator
class Company(object):
def __init__(self, employee_list):
self.employee = employee_list
def __iter__(self):
return MyIterator(self.employee)
#自定义迭代器
class MyIterator(Iterator): #如果不继承Iterator,则必须实现__iter__方法
def __init__(self, employee_list):
self.iter_list = employee_list
self.index = 0 #初始化索引位置
def __next__(self):
#真正返回迭代值的逻辑
try:
word = self.iter_list[self.index]
except IndexError:
raise StopIteration
self.index += 1
return word
if __name__ == "__main__":
company = Company(["derek1", "derek2", "derek3"])
my_itor = iter(company)
print(next(my_itor)) #derek1
print(next(my_itor)) #derek2
print(next(my_itor)) #derek3
for item in company:
print (item) #derek1 derek2 derek3
(1)生成器函数和普通函数的区别
#函数里只要有yield关键字,就是生成器函数
def gen_func():
yield 1
def func():
return 1
if __name__ == '__main__':
gen = gen_func()
print(type(gen)) #<class 'generator'> 返回的是一个生成器对象
res = func()
print(type(res)) #<class 'int'> 返回1
pass
(2)取出生成器里面的值
#函数里只要有yield关键字,就是生成器函数
def gen_func():
yield 1
yield 2
yield 3
if __name__ == '__main__':
gen = gen_func()
print(type(gen)) #<class 'generator'> 返回的是一个生成器对象
for value in gen:
print(value) # 1,2,3
(3)斐波那契的例子
def fib(index):
re_list = []
n,a,b = 0,0,1
while n < index:
re_list.append(b)
a,b = b, a+b
n += 1
return re_list
print(fib(10)) #[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]
假如当数据量非常大的时候,这样全部打印会消耗非常大的内存,下面使用yield,虽然同样是获取数据,但是它实际上是不消耗内存的
def gen_fib(index):
n,a,b = 0,0,1
while n < index:
yield b
a,b = b, a+b
n += 1
for data in gen_fib(10):
print(data) # 1, 1, 2, 3, 5, 8, 13, 21, 34, 55