前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python语言的精华:Itertools库

Python语言的精华:Itertools库

作者头像
HuangWeiAI
发布2020-09-23 14:32:20
8780
发布2020-09-23 14:32:20
举报
文章被收录于专栏:浊酒清味浊酒清味

前言

你知道Python的Itertools库被认为是Python的瑰宝吗?一些用户甚至认为它是最酷和最令人惊叹的Python库之一。我们可以使用Itertools模块来丰富我们的应用程序,并在更短的时间内创建一个可靠的工作解决方案。

本文将帮助读者理解如何在项目中使用Itertools模块。

文章分为三个部分,每个部分将解释Itertools库的特定功能。具体来说:

  1. 无限的迭代器
  2. 终止迭代器
  3. 组合迭代器

概念简介

什么是迭代器?

迭代器是由__next__方法组成的对象。它有一个状态。状态用于记住迭代期间的执行。因此,迭代器知道它的当前状态,这使它的内存效率高。这就是为什么在内存高效和快速的应用程序中使用迭代器的原因。

我们可以打开无限的数据流(比如读取文件)并获取下一项(比如文件中的下一行)。然后我们可以对项目执行一个操作,并继续进行下一个项目。这可能意味着我们可以有一个返回无限个元素的迭代器,因为我们只需要知道当前项。

当没有下一个要返回的项时,迭代器会引发StopIteration异常。

什么是可迭代的?

iterable是可以返回迭代器的对象。它有一个__iter__方法返回一个迭代器。iterable也是一个我们可以循环并可以调用iter()的对象。它有一个__getitem__方法,它可以从0开始取连续索引(并在索引不再有效时引发一个IndexError)。

什么是Itertools?

Itertools是Python模块,是Python 3标准库的一部分。它允许我们在迭代器上执行高效的内存和计算任务。它的灵感来自APL、Haskell和SML的构造。

从本质上讲,该模块包含许多快速且内存效率高的方法,这些方法可以帮助我们用纯Python简洁而高效地构建应用程序。

无限迭代器

如果我们想构造一个返回无限均匀间隔值的迭代器呢?或者,如果我们必须从迭代器生成一个元素循环呢?或者,也许我们想要重复迭代器的元素?

itertools库提供了一组函数,我们可以使用这些函数来执行所需的所有功能。

本节中列出的三个函数构造并返回可以是无限项流的迭代器。

Count

作为实例,我们可以生成一个等距值的无限序列:

代码语言:javascript
复制
start = 10
stop = 1
my_counter = it.count(start, stop)
for i in my_counter:
    # this loop will run for ever
    print(i)

结果:

代码语言:javascript
复制
10
11
12
13
14
15

Cycle

我们可以使用cycle方法从输入中生成无限循环的元素。

该方法的输入需要是可迭代的对象,比如列表、字符串或字典等

代码语言:javascript
复制
my_cycle = it.cycle('Python')
for i in my_cycle:
    print(i)

结果:

代码语言:javascript
复制
P
y
t
h
o
n
P
y
t
h
o
n
P

Repeat

要重复一个项(例如字符串或集合),可以使用repeat()函数:

代码语言:javascript
复制
to_repeat = 'FM'
how_many_times = 4
my_repeater = it.repeat(to_repeat, how_many_times)
for i in my_repeater:
    print(i)
#Prints
FM
FM
FM
FM

这将重复字符串“FM”4次。如果我们不提供第二个参数,那么它将无限次重复这个字符串。

终止迭代器

在本节中,我将说明终止迭代的强大特性。这些函数可以用于许多场景,例如:

  1. 我们可能有很多迭代,我们想在一个序列中一个一个地对所有迭代的元素执行一个操作。
  2. 或者当我们有很多函数想要对iterable的每个元素执行时
  3. 或者有时我们就从迭代器中删除元素,然后对其他元素执行操作。

Chain

这个方法允许我们创建一个迭代器,它返回序列中所有输入迭代中的元素,直到没有元素剩下为止。因此,它可以将连续序列视为单个序列。

代码语言:javascript
复制
chain = it.chain([1,2,3], ['a','b','c'], ['End'])
for i in chain:
    print(i)

结果

代码语言:javascript
复制
1
2
3
a
b
c
End

Drop While

我们可以传递一个iterable和一个条件,这个方法将开始对每个元素计算条件,直到条件对一个元素返回False为止。一旦某个元素的条件值为False,该函数将返回可迭代的其余元素。

例如,假设我们有一个作业列表,并且我们希望遍历元素,并且只有在不满足条件时才返回元素。一旦条件的值为False,我们期望返回迭代器的其余元素。

代码语言:javascript
复制
jobs = ['job1', 'job2', 'job3', 'job10', 'job4', 'job5']
dropwhile = it.dropwhile(lambda x : len(x)==4, jobs)
for i in dropwhile:
    print(i)

结果:

代码语言:javascript
复制
job10
job4
job5

该方法返回了上面的三项,因为元素job10的长度不等于4个字符,因此返回了job10和其他元素。

Take While

这个方法与dropwhile()方法相反。本质上,它返回一个iterable的所有元素,直到第一个条件返回False,然后它不返回任何其他元素。

例如,假设我们有一个作业列表,并且希望在不满足条件时立即停止返回作业。

代码语言:javascript
复制
jobs = ['job1', 'job2', 'job3', 'job10', 'job4', 'job5']
takewhile = it.takewhile(lambda x : len(x)==4, jobs)
for i in takewhile:
    print(i)

结果:

代码语言:javascript
复制
job1
job2
job3

GroupBy

这个函数在将可迭代的连续元素分组之后构造一个迭代器。该函数返回一个键、值对的迭代器,其中键是组键,值是按键分组的连续元素的集合。

考虑以下代码片段:

代码语言:javascript
复制
iterable = 'FFFAARRHHHAADDMMAAALLIIKKK'
my_groupby = it.groupby(iterable)
for key, group in my_groupby:
    print('Key:', key)
    print('Group:', list(group))

注意,group属性是可迭代的,因此我将其具体化为一个列表。

因此,这将打印:

代码语言:javascript
复制
Key: F
Group: [‘F’, ‘F’, ‘F’]
Key: A
Group: [‘A’, ‘A’]
Key: R
Group: [‘R’, ‘R’]
Key: H
Group: [‘H’, ‘H’, ‘H’]
Key: A
Group: [‘A’, ‘A’]
Key: D
Group: [‘D’, ‘D’]
Key: M
Group: [‘M’, ‘M’]
Key: A
Group: [‘A’, ‘A’, ‘A’]
Key: L
Group: [‘L’, ‘L’]
Key: I
Group: [‘I’, ‘I’]
Key: K
Group: [‘K’, ‘K’, ‘K’]

Tee

该方法可以拆分一个迭代,并从输入中生成新的迭代。输出也是一个迭代器,它返回给定数量的项的可迭代值。为了更好地理解它,请看下面的代码片段:

代码语言:javascript
复制
iterable = 'FM'
tee = it.tee(iterable, 5)
for i in tee:
    print(list(i))

这个方法返回整个可迭代FM, 5次:

代码语言:javascript
复制
[‘F’, ‘M’]
[‘F’, ‘M’]
[‘F’, ‘M’]
[‘F’, ‘M’]
[‘F’, ‘M’]

组合迭代器

Permutations

通过使用permutation方法,我们可以创建一个迭代器来返回输入iterable中元素的连续排列。

我们可以传入一个参数来指定排列的长度。它默认为可迭代的长度。

这意味着当缺少长度时,该方法将生成所有可能的全长排列。

代码语言:javascript
复制
iterable = 'FM1'
length = 2
permutations = it.permutations(iterable, length)
for i in permutations:
    print(i)

结果

代码语言:javascript
复制
(‘F’, ‘M’, ‘1’)
(‘F’, ‘1’, ‘M’)
(‘M’, ‘F’, ‘1’)
(‘M’, ‘1’, ‘F’)
(‘1’, ‘F’, ‘M’)
(‘1’, ‘M’, ‘F’)

如果长度为2,则生成:

代码语言:javascript
复制
(‘F’, ‘M’)
(‘F’, ‘1’)
(‘M’, ‘F’)
(‘M’, ‘1’)
(‘1’, ‘F’)
(‘1’, ‘M’)
(‘F’, ‘M’)
(‘F’, ‘1’)
(‘M’, ‘1’)

Combinations

最后,我想解释一下如何生成iterable的组合。

给定一个可迭代器,我们可以构造一个迭代器来返回给定长度的元素的子序列。

根据它们的位置,元素被视为唯一的,并且只返回不同的元素。

代码语言:javascript
复制
iterable = 'FM1'
combinations = it.combinations(iterable, 2)
for i in combinations:
    print(i)

结果

代码语言:javascript
复制
(‘F’, ‘M’)
(‘F’, ‘1’)
(‘M’, ‘1’)

·END·

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-09-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python学会 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档