generator归根到底是一个函数的返回值,这个函数是包含“yield”关键字的python函数。是不是可以这么说(不是很确定,似乎可以这么理解)
1,凡包含“yield”关键字的函数,都返回generator
2,generator不是函数,而是函数执行后构造的对象,是一种iterator。
3,generator可以像iterator一样的用。
generator的根源是PEP 255,其中列出了generator在Python存在的原因,简单的讲,Generator在需要时返回中间值,能够保存当前的状态,等待下一次的返回要求。
xrange/range的区别或许可以帮我们理解这一点,xrange之所以存在,是因为range需要一次完成列表的初始化,存储等等,从C的角度来理解,就是,用range等于先malloc足够的内存,然后完成值的准备,等待调用(遍历等等)。而xrange则不这么干,什么时候要的时候,什么时候给值。所以,在Python 2.x中,type(range(10))是一个List,是内存中的静态数据;而type(xrange(10))则是一个range type。
到Python 3.x,xrange彻底替代了range函数。
这样设计的目的无非就是节省内存 ,千八百数字的无所谓,但ython 2.x的long int和Python 3.x的Int是无限制(用官方语言来说就是可以占满内存)。
generator为了满足这种需求设计的,状态得到了保存,随取随算。
PEP 255有一句: a Python generator is a kind of Python iterator[1], but of an especially powerful kind.
Python的产生器就是一种迭代器...
因为它是一种迭代器,所以,他可以用到for等控制流中。
def gen():
print "one"
yield 1
print "two"
yield 2
print "three"
yield 3
type(gen)
type(gen())
可以看到gen是函数,而gen()是generator,应该说,函数gen执行的返回值是生成一个generator。
generator的方法之一就是next()。
a=gen()
a.next()
a.next()
a.next()
a.next()
三次next,分别返回了1,2,3,最后一次,已到达末尾,发生StopIteration错误。
而yield的作用就是,每次发生next()调用,函数执行完yield语句之后在挂起,这时返回yield的值(你原因yield啥就yield啥),整个函数状态被保存,等待下一次next()调用;
下次next()调用发生时,从yield后的语句开始执行(有yiled也在循环体内,未必一定是顺序的),直到再次遇到yield为止,然后重复删除动作。
yield 可以解读为"返回然后等待"。知道所有yield语句完成,这时如果再次调用next(),则发生StopIteration异常,当然,在for循环之类的语句中会被自动处理。
<--- XDICT英汉辞典 --->
yield
[jiːld]
n. 生产量,投资收益
vt. 生产,给予,同意,被迫放弃,放纵
vi. 出产,屈服,投降
在这里,当然是“生产”的意思。
PEP 255详细解释了为什么是
"新关键字" yield,而不是return 变体等等的原因。
我想,一个简单的原因可能是return已经被大家清楚、牢靠的理解成了"函数的结束并返回“,而不是”返回并挂起“。
而在generator中(严格的说应该是返回值为generator的函数中),return仍然是这个意思。但,这里有个小小的要求,
return不能返回任何值,哪怕是None。而return的作用跟其他地方一样,“返回”。
def g():
print "one"
yield 1
print "two"
yield 2
print "three"
return
yield 3
a=g()
a.next()#yield 1
a.next()#yield 2
a.next()#return and raise StopIteration
这里的return,作的事情是返回(表示iterator用光)并产生raise StopIteration异常。
如果在yield中产生了任何异常,则直接传递给调用者,generator无法再次唤醒。
比如:
def err():
raise KeyError
def gen():
yield err()
yield 2
a=gen()
a.next()#引发异常,KeyError
a.next()#引发StopIteration异常,并不是2。
在Python 3.x中,obj.next()被修改为next(obj),这是需要注意的一点。
阅读(944) | 评论(1) | 转发(0) |