Python关键字yield详解

JnX 2013-01-30

迭代器(Iterator)

为了理解yield是什么,首先要明白生成器(generator)是什么,在讲生成器之前先说说迭代器(iterator),当创建一个列表(list)时,你可以逐个的读取每一项,这就叫做迭代(iteration)。

mylist = [1, 2, 3]   



 for i in mylist :   




 print(i)   




1 




2 




3 

Mylist就是一个迭代器,不管是使用复杂的表达式列表,还是直接创建一个列表,都是可迭代的对象。

mylist = [x*x for x in range(3)]   



for i in mylist :   




print(i)   




0 




1 




4 

你可以使用“for··· in ···”来操作可迭代对象,如:list,string,files,这些迭代对象非常方便我们使用,因为你可以按照你的意愿进行重复的读取。但是你不得不预先存储所有的元素在内存中,那些对象里有很多元素时,并不是每一项都对你有用。

生成器(Generators)

生成器同样是可迭代对象,但是你只能读取一次,因为它并没有把所有值存放内存中,它动态的生成值:

mygenerator = (x*x for x in range(3))   



for i in mygenerator :   




print(i)   




0 




1 




4 

使用()和[]结果是一样的,但是,第二次执行“ for in mygenerator”不会有任何结果返回,因为它只能使用一次。首先计算0,然后计算1,之后计算4,依次类推。

迭代工具模块包含了操做指定的函数用于操作迭代器。想复制一个迭代器出来?链接两个迭代器?以one liner(这里的one-liner只需一行代码能搞定的任务)用内嵌的列表组合一组值?不使用list创建Map/Zip?···,你要做的就是 import itertools,举个例子吧:

四匹马赛跑到达终点排名的所有可能性:

>>> horses = [1, 2, 3, 4]   


>>> races = itertools.permutations(horses)   



>>> print(races)   




<itertools.permutations object at 0xb754f1dc>   




>>> print(list(itertools.permutations(horses)))   




[(1, 2, 3, 4),   




 (1, 2, 4, 3),   




 (1, 3, 2, 4),   




 (1, 3, 4, 2),   




 (1, 4, 2, 3),   




 (1, 4, 3, 2),   




 (2, 1, 3, 4),   




 (2, 1, 4, 3),   




 (2, 3, 1, 4),   




 (2, 3, 4, 1),   




 (2, 4, 1, 3),   




 (2, 4, 3, 1),   




 (3, 1, 2, 4),   




 (3, 1, 4, 2),   




 (3, 2, 1, 4),   




 (3, 2, 4, 1),   




 (3, 4, 1, 2),   




 (3, 4, 2, 1),   




 (4, 1, 2, 3),   




 (4, 1, 3, 2),   




 (4, 2, 1, 3),   




 (4, 2, 3, 1),   




 (4, 3, 1, 2),   




 (4, 3, 2, 1)] 

理解迭代的内部机制:

迭代(iteration)就是对可迭代对象(iterables,实现了__iter__()方法)和迭代器(iterators,实现了__next__()方法)的一个操作过程。可迭代对象是任何可返回一个迭代器的对象,迭代器是应用在迭代对象中迭代的对象,换一种方式说的话就是:iterable对象的__iter__()方法可以返回iterator对象,iterator通过调用next()方法获取其中的每一个值(译者注),读者可以结合Java API中的 Iterable接口和Iterator接口进行类比。

相关推荐