可迭代对象
什么叫做迭代
通过之前的学习,我们已经知道对于list、tuple、str等类型的数据,我们可以使用for i in xxx
的语法进行循环取值,我们把这样的过程称之为遍历,也叫做迭代
如下:
li = [1, 2, 3, 'a', 'b', 'c']
for i in li:
print(i)
str = "hello,world"
for j in str:
print(j)
dic = {'name': 'nls', 'age': 18, 'job': 'teacher'}
for k,v in dic.items():
print(k,v)
# ......
Q:整数类型可以迭代吗?可以动手试一下....
如何判断一个对象是否可迭代
我们可以用Python中内置的isinstance()
方法来判断某个对象是Iterable对象,也可以称之为可迭代对象
# 字符串、列表、元组、字典、集合都可以被for循环,说明他们都是可迭代的
from collections.abc import Iterable
l = [1, 2, 3, 4]
t = (1, 2, 3, 4)
d = {1: 2, 3: 4}
s = {1, 2, 3, 4}
a = 100
print(isinstance(l, Iterable))
print(isinstance(t, Iterable))
print(isinstance(d, Iterable))
print(isinstance(s, Iterable))
print(isinstance(a, Iterable))
# Output:
True
True
True
True
False
迭代器
Python 中,迭代器是一种用于遍历集合(如列表、元组、字典等)中元素的对象。
可迭代对象通过__iter__
方法向我们提供一个迭代器,我们在迭代一个可迭代对象的时候,实际上就是先获取该对象提供的一个迭代器,然后通过这个迭代器来依次获取对象中的每一个数据。
上面讲到迭代是访问集合元素的一种方式。而迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
那么也就是说,一个具备了__iter__
方法的对象,就是一个可迭代对象。
l = [1, 2, 3, 4]
t = (1, 2, 3, 4)
d = {1: 2, 3: 4}
s = {1, 2, 3, 4}
print(dir(l))
print(dir(t))
print(dir(d))
print(dir(s))
迭代器的本质
我们分析对可迭代对象进行迭代使用的过程,发现每迭代一次(即在for...in...中每循环一次)都会返回对象中的下一条数据,一直向后读取数据直到迭代了所有数据后结束。那么,在这个过程中就应该有一个“人”去记录每次访问到了第几条数据,以便每次迭代都可以返回下一条数据。我们把这个能帮助我们进行数据迭代的“人”称为迭代器(Iterator)。
迭代器协议
迭代器遵循迭代协议,内部主要定义了__iter__()
和__next__()
两个方法
__iter__()
方法用于初始化一个迭代器,返回迭代器本身__next__()
方法用于迭代下一个数据。当没有元素可返回时,抛出StopIteration
异常。
初始化迭代器
list1 = [1,2,3,'a','b','c']
list_iter = list1.__iter__() # list是可迭代对象,这里我们调用iter方法初始化一个迭代器list_iter
item = list_iter.__next__() # 这里通过next方法来获取下一个数据
print(item)
item = list_iter.__next__()
print(item)
item = list_iter.__next__()
print(item)
item = list_iter.__next__()
print(item)
item = list_iter.__next__()
print(item)
item = list_iter.__next__()
print(item)
如果超出迭代范围,会触发StopIteration异常。我们可以加上异常处理,取完值后自动停止
list1 = [1,2,3,'a','b','c']
list_iter = list1.__iter__()
while True:
try:
print(next(list_iter)) # 这里是next方法的另一种写法
except StopIteration:
print('迭代完成')
break
如何判断一个对象是迭代器
我们同样可以用内置的isinstance()
方法来判断某个对象是否是Iterator 对象(迭代器)
from collections.abc import Iterator
list1 = [1,2,3,'a','b','c']
list_iter = list1.__iter__()
print(isinstance(list1, Iterator))
print(isinstance(list_iter, Iterator))
print(isinstance(iter(list1), Iterator)) # 初始化迭代器的另一种方法
# Output:
False
True
True
for循环的本质
我们常用的for循环其实本质上就是迭代器协议的一种具体实现,为我们提供了一个遍历的迭代元素的方法。
工作原理:
当你使用 for
循环遍历一个可迭代对象时,实际上发生了以下几个步骤:
- 调用
__iter__()
:for
循环首先调用对象的__iter__()
方法,获取一个迭代器对象。
- 调用
__next__()
:- 然后,
for
循环在迭代器上反复调用__next__()
方法,以获取下一个元素。
- 然后,
- 处理
StopIteration
:- 一旦
__next__()
抛出StopIteration
异常,for
循环停止迭代。
- 一旦
生成器
生成器是 Python 中一种特殊的迭代器,允许你以一种简单而高效的方式生成序列。
生成器的原理
状态保持:生成器通过 yield
语句保存函数的状态。在每次调用生成器时,函数会从上一个 yield
语句的下一行继续执行,而不仅仅是从函数的开始处执行。
迭代器接口:生成器实现了迭代器协议,因此可以使用 for
循环进行遍历。
生成器函数
生成器也是一个函数,但与普通函数不同的是,它使用 yield
语句来返回值。每次调用生成器函数时,它会从上次 yield
的地方继续执行,直到遇到下一个 yield
或函数结束。
所以说,如果一个函数中使用yield来返回值,那么可以认为这是一个生成器函数
并且调用生成器函数不会得到返回的具体的值,而是得到一个迭代器。每一次获取这个迭代器值,就能推动函数的执行,获取新的返回值。直到函数执行结束。
def numbers(n):
"""生成从 1 到 n 的自然数"""
for i in range(1,n+1):
yield i
for i in numbers(10):
print(i)
惰性求值
生成器在需要时生成值,而不是一次性计算和返回所有值。这可以节省内存,特别是处理大型数据集时。
案例:重生之我在早餐的卖包子
我重生了,重生在了高考的前一天,由于上一世我参加了高考最后只能上个大专,毕业了一事无成。这一生,我要成为商业巨头......
一抬头,有一个卖包子的店铺正在转让,我决定从这里开始我的梦幻人生...
言归正传,如果卖包子,那么我一下子生成100笼包子,没地方放的同时还容易坏。我们可不可以等到有顾客下单的时候再去生成?
def produce():
# 生产包子
for i in range(1,100):
yield f'生产了第{i}笼包子'
produce_g = produce()
print(produce_g.__next__())
print(produce_g.__next__())
print(produce_g.__next__())
# 顾客下单了,需要5笼包子
for i in range(5):
print(produce_g.__next__())
# Output:
生产了第1笼包子
生产了第2笼包子
生产了第3笼包子
生产了第4笼包子
生产了第5笼包子
生产了第6笼包子
生产了第7笼包子
生产了第8笼包子
send
send 获取下一个值的效果和next基本一致 只是在获取下一个值的时候,给上一yield的位置传递一个数据 使用send的注意事项
- 第一次使用生成器的时候 是用next获取下一个值
- 最后一个yield不能接受外部的值
def generator():
print(123)
content = yield 1
print('欢迎来到',content)
print(456)
yield 2
g = generator()
ret = g.__next__()
print('***',ret)
ret = g.send('英格科技')
print('***',ret)
# Output:
123
*** 1
欢迎来到 英格科技
456
*** 2