Python中的迭代器和生成器

文章来源：企鹅号 - 据说百科

迭代器

概念

迭代器是Python中一种特殊的对象，它可以实现对一个集合中的元素逐一访问，而不必在内存中创建一个完整的列表或者元组等数据结构。迭代器是实现迭代的基础，几乎所有的容器都可以通过迭代器来访问其元素。

迭代器的基本操作包括两个方法：

__next__()：用于返回迭代器中的下一个元素，如果没有更多元素则抛出StopIteration异常。

__iter__()：返回迭代器对象本身，用于在迭代器内部实现迭代器协议。

特点

Python中的迭代器具有以下几个特点：

惰性求值：迭代器仅在需要下一个元素时才会计算下一个元素的值，这样可以节省大量的内存空间和计算时间。

一次性消费：迭代器只能遍历一次，因为遍历完毕后，指针已经指向了迭代器的末尾，不能再次访问。

适用于大型数据集：当数据集非常大的时候，迭代器可以节省大量的内存空间。

使用方法

在Python中，可以使用iter()函数来创建一个迭代器，该函数需要一个可迭代的对象作为参数，返回一个迭代器对象。

>>> mylist = [1, 2, 3, 4, 5]

>>> it = iter(mylist)

>>> print(next(it)) 1

>>> print(next(it)) 2

>>> print(next(it)) 3

上述代码中，首先定义了一个列表mylist，然后使用iter()函数将其转换为一个迭代器对象it，最后使用next()函数逐一访问迭代器中的元素。

除了使用iter()函数创建迭代器，还可以使用生成器来创建迭代器。

生成器

概念

生成器是一种特殊的迭代器，它是通过函数来实现的。生成器函数可以返回一个迭代器对象，而不是像普通函数那样返回一个值。生成器可以实现惰性求值，节省内存空间，同时也可以一次性消费。

生成器函数定义的格式如下：

def generator_function():

# 生成器函数体 yield value

在生成器函数中，使用yield语句来返回一个元素，每次调用生成器函数时，函数会从上一次停止的位置继续执行，直到遇到yield语句返回下一个元素。

特点

Python中的生成器具有以下几个特点：

惰性求值：生成器仅在需要下一个元素时才会计算下一个元素的值，这样可以节省大量的内存空间和计算时间。

一次性消费：生成器只能遍历一次，因为遍历完毕后，指针已经指向了生成器的末尾，不能再次访问。

可以无限制生成数据：由于生成器只在需要时才计算下一个元素，因此可以无限制地生成数据，适用于无限序列的情况。

使用方法

生成器函数可以使用yield语句来返回下一个元素。当调用生成器函数时，函数并不立即执行，而是返回一个生成器对象。当遍历生成器对象时，生成器函数才会被执行，每次执行到yield语句时会返回一个元素，直到函数执行结束或者遇到return语句。

以下是一个简单的生成器函数的例子，用于生成斐波那契数列：

def fibonacci():

a, b = 0, 1

while True:

yield a

a, b = b, a + b

在上述代码中，定义了一个无限循环的生成器函数fibonacci()，每次返回斐波那契数列中的下一个元素。

可以使用next()函数来遍历生成器对象，每次调用next()函数都会返回生成器函数中yield语句返回的下一个元素。如果生成器函数已经返回了所有的元素，再次调用next()函数会抛出StopIteration异常。

>>> fib = fibonacci()

>>> next(fib) 0

>>> next(fib) 1

>>> next(fib) 2

>>> next(fib) 3

>>> next(fib) 5

除了使用next()函数遍历生成器对象，还可以使用for循环遍历生成器对象。由于生成器对象是可迭代的，因此可以直接使用for循环遍历。

for f in fibonacci():

if f > 1000:

break print(f)

在上述代码中，遍历生成器对象fibonacci()，如果生成的斐波那契数列中的元素大于1000，则退出循环。

总结

迭代器和生成器是Python中非常重要的概念，它们可以帮助开发者更方便地处理数据，实现高效的程序。迭代器是一种实现迭代的基础，可以遍历各种容器中的元素，同时也可以自己定义一个迭代器。生成器是一种特殊的迭代器，是一种更加高级的迭代器，能够节省大量内存和计算时间，特别适合于处理大量数据的情况。

在实际开发中，我们常常需要处理一些大量数据的情况，这时使用生成器就可以大大节省内存和计算时间。例如，我们需要处理一个非常大的文件，文件可能包含数百万行数据，如果直接将文件读入内存中，就会导致内存溢出。而使用生成器，则可以逐行读取文件中的数据，一行一行地进行处理，大大减少了内存的消耗。

同时，生成器也非常适合于处理无限序列的情况，例如生成斐波那契数列、素数序列等。下面列举一个用生成器读取大文件的例子：

def read_file(filename):

with open(filename, 'r') as f:

for line in f:

yield line.strip()

在上述代码中，定义了一个生成器函数read_file()，使用with open语句打开文件，并使用for循环逐行读取文件内容，每次读取一行后使用yield语句返回该行内容，并将末尾的换行符去掉。

可以使用next()函数或者for循环遍历生成器对象，每次调用next()函数或遍历for循环read_file()函数都会返回文件中的下一行内容。

for line in read_file('test.txt'):

print(line)

在上述代码中，遍历生成器对象read_file('test.txt')，每次返回文件中的下一行内容并输出。

需要注意的是，使用生成器读取文件时，如果文件内容比较大，可能会造成文件句柄没有及时关闭，因此需要使用with open语句打开文件，确保文件句柄能够在读取完毕后自动关闭，以避免资源泄漏问题。

发表于: 2023-02-192023-02-19 13:17:33
原文链接：https://kuaibao.qq.com/s/20230219A032XO00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

Python中的迭代器和生成器

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐