joyjoy0 2020-09-18
你知道Python的Itertools库被认为是Python的瑰宝吗?一些用户甚至认为它是最酷和最令人惊叹的Python库之一。我们可以使用Itertools模块来丰富我们的应用程序,并在更短的时间内创建一个可靠的工作解决方案。
本文将帮助读者理解如何在项目中使用Itertools模块。
文章分为三个部分,每个部分将解释Itertools库的特定功能。具体来说:
一、概念简介
1. 什么是迭代器?
迭代器是由__next__方法组成的对象。它有一个状态。状态用于记住迭代期间的执行。因此,迭代器知道它的当前状态,这使它的内存效率高。这就是为什么在内存高效和快速的应用程序中使用迭代器的原因。
我们可以打开无限的数据流(比如读取文件)并获取下一项(比如文件中的下一行)。然后我们可以对项目执行一个操作,并继续进行下一个项目。这可能意味着我们可以有一个返回无限个元素的迭代器,因为我们只需要知道当前项。
当没有下一个要返回的项时,迭代器会引发StopIteration异常。
2. 什么是可迭代的?
iterable是可以返回迭代器的对象。它有一个__iter__方法返回一个迭代器。iterable也是一个我们可以循环并可以调用iter()的对象。它有一个__getitem__方法,它可以从0开始去连续索引(并在索引不再有效时引发一个IndexError)。
3. 什么是Itertools?
Itertools是Python模块,是Python 3标准库的一部分。它允许我们在迭代器上执行高效的内存和计算任务。它的灵感来自APL、Haskell和SML的构造。
从本质上讲,该模块包含许多快速且内存效率高的方法,这些方法可以帮助我们用纯Python简洁而高效地构建应用程序。
二、无限迭代器
如果我们想构造一个返回无限均匀间隔值的迭代器呢?或者,如果我们必须从迭代器生成一个元素循环呢?或者,也许我们想要重复迭代器的元素?
itertools库提供了一组函数,我们可以使用这些函数来执行所需的所有功能。
本节中列出的三个函数构造并返回可以是无限项流的迭代器。
1. Count
作为实例,我们可以生成一个等距值的无限序列:
start = 10 stop = 1 my_counter = it.count(start, stop) for i in my_counter: # this loop will run for ever print(i)
结果:
10 11 12 13 14 15
2. Cycle
我们可以使用cycle方法从输入中生成无限循环的元素。
该方法的输入需要是可迭代的对象,比如列表、字符串或字典等:
my_cycle = it.cycle('Python') for i in my_cycle: print(i)
结果:
P ythonPythonP
3. Repeat
要重复一个项(例如字符串或集合),可以使用repeat()函数:
to_repeat = 'FM' how_many_times = 4 my_repeater = it.repeat(to_repeat, how_many_times)for i in my_repeater: print(i)#Prints FM FM FM FM
这将重复字符串“FM”4次。如果我们不提供第二个参数,那么它将无限次重复这个字符串。
三、终止迭代器
在本节中,我将说明终止迭代的强大特性。这些函数可以用于许多场景,例如:
1. Chain
这个方法允许我们创建一个迭代器,它返回序列中所有输入迭代中的元素,直到没有元素剩下为止。因此,它可以将连续序列视为单个序列。
chain = it.chain([1,2,3], ['a','b','c'], ['End']) for i in chain: print(i)
结果:
1 23abcEnd
2. Drop While
我们可以传递一个iterable和一个条件,这个方法将开始对每个元素计算条件,直到条件对一个元素返回False为止。一旦某个元素的条件值为False,该函数将返回可迭代的其余元素。
例如,假设我们有一个作业列表,并且我们希望遍历元素,并且只有在不满足条件时才返回元素。一旦条件的值为False,我们期望返回迭代器的其余元素。
jobs = ['job1', 'job2', 'job3', 'job10', 'job4', 'job5'] dropwhile = it.dropwhile(lambda x : len(x)==4, jobs) for i in dropwhile: print(i)
结果:
job10 job4job5
该方法返回了上面的三项,因为元素job10的长度不等于4个字符,因此返回了job10和其他元素。
3. Take While
这个方法与dropwhile()方法相反。本质上,它返回一个iterable的所有元素,直到第一个条件返回False,然后它不返回任何其他元素。
例如,假设我们有一个作业列表,并且希望在不满足条件时立即停止返回作业。
jobs = ['job1', 'job2', 'job3', 'job10', 'job4', 'job5'] takewhile = it.takewhile(lambda x : len(x)==4, jobs) for i in takewhile: print(i)
结果:
job1 job2job3
4. GroupBy
这个函数在将可迭代的连续元素分组之后构造一个迭代器。该函数返回一个键、值对的迭代器,其中键是组键,值是按键分组的连续元素的集合。
考虑以下代码片段:
iterable = 'FFFAARRHHHAADDMMAAALLIIKKK' my_groupby = it.groupby(iterable)for key, group in my_groupby: print('Key:', key) print('Group:', list(group))
注意,group属性是可迭代的,因此我将其具体化为一个列表。
因此,这将打印:
Key: F Group: [‘F’, ‘F’, ‘F’] Key: A Group: [‘A’, ‘A’] Key: R Group: [‘R’, ‘R’] Key: H Group: [‘H’, ‘H’, ‘H’] Key: A Group: [‘A’, ‘A’] Key: D Group: [‘D’, ‘D’] Key: M Group: [‘M’, ‘M’] Key: A Group: [‘A’, ‘A’, ‘A’] Key: L Group: [‘L’, ‘L’] Key: I Group: [‘I’, ‘I’] Key: K Group: [‘K’, ‘K’, ‘K’]
5. Tee
该方法可以拆分一个迭代,并从输入中生成新的迭代。输出也是一个迭代器,它返回给定数量的项的可迭代值。为了更好地理解它,请看下面的代码片段:
iterable = 'FM' tee = it.tee(iterable, 5) for i in tee: print(list(i))
这个方法返回整个可迭代FM, 5次:
[‘F’, ‘M’] [‘F’, ‘M’][‘F’, ‘M’][‘F’, ‘M’][‘F’, ‘M’]
四、组合迭代器
1. Permutations
通过使用permutation方法,我们可以创建一个迭代器来返回输入iterable中元素的连续排列。
我们可以传入一个参数来指定排列的长度。它默认为可迭代的长度。
这意味着当缺少长度时,该方法将生成所有可能的全长排列。
iterable = 'FM1' length = 2 permutations = it.permutations(iterable, length) for i in permutations: print(i)
结果:
(‘F’, ‘M’, ‘1’) (‘F’, ‘1’, ‘M’)(‘M’, ‘F’, ‘1’)(‘M’, ‘1’, ‘F’)(‘1’, ‘F’, ‘M’)(‘1’, ‘M’, ‘F’)
如果长度为2,则生成:
(‘F’, ‘M’) (‘F’, ‘1’)(‘M’, ‘F’)(‘M’, ‘1’)(‘1’, ‘F’)(‘1’, ‘M’)(‘F’, ‘M’)(‘F’, ‘1’)(‘M’, ‘1’)
2. Combinations
最后,我想解释一下如何生成iterable的组合。
给定一个可迭代器,我们可以构造一个迭代器来返回给定长度的元素的子序列。
根据它们的位置,元素被视为唯一的,并且只返回不同的元素。
iterable = 'FM1' combinations = it.combinations(iterable, 2) for i in combinations: print(i)
结果:
(‘F’, ‘M’) (‘F’, ‘1’)(‘M’, ‘1’)