首页 > 脚本专栏 > python > Python迭代器、生成器、协程

Python迭代器、生成器、协程使用方式

2024-02-20 08:56:20 作者：不必介怀

这篇文章主要介绍了Python迭代器、生成器、协程使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

什么是迭代

迭代是访问集合元素的一种方式。（迭代和遍历非常相似）

什么是迭代器（Iterator）

迭代器是一种对象，可以记住遍历的位置的对象。迭代器对象从集的第一个元素开始访问，直到所有的元素被访问完结束。

在迭代一个可迭代对象的时候，实际上就是先获取该对象提供的一个迭代器，然后通过这个迭代器来依次获取对象中的每一个数据。

可迭代对象

某种数据可以通过for....in....的循环语法从其中依次拿到数据进行使用的数据类型，这种数据类型被称为可迭代对象

检测某个对象是否是可迭代对象的方法isinstance(待检测对象，Iterable)

该方法检测待检测对象是不是Iterable迭代类的子类

如果是返回True,如果不是返回False

from collections.abc import Iterable
 
"""
isinstance(待检测对象，Iterable（迭代类，固定写法）)
判断待检测对象是不是迭代类的一个子类
返回值：True可以迭代
    False不可以迭代
"""
string="fhsudfoh"
result=isinstance([1,2,3],Iterable)
print(result)

for循环的本质

for循环的本质是在对一个迭代器进行操作。

首先，for循环在遍历可迭代对象的时候会把可迭代对象通过函数iter()或__iter__方法返回一个迭代器，然后在对这个迭代器对象进行操作。

迭代器可以用next()或__next__方法得到返回值，当把所有的值取完时会抛出StopIteration错误，这个错误在for循环中python会自己处理，不会展示给开发者。

自定义一个列表

class MyList(object):
# 重写初始化方法，初始化一个数组用来存储数据
    def __init__(self):
        self.list = []
 
    def __iter__(self):
# iter方法返回一个myIterator迭代器对象
        self.myiterator = MyIterator(self.list)
        return self.myiterator
 
    def additer(self, values):
# additer方法用于添加数据
        self.list.append(values)
 
 
class MyIterator(object):
# 初始化一个下标和接收一个外部的数组变量
    def __init__(self, my_list):
        self.list = my_list
        self.index = 0
 
    def __iter__(self):
        pass
# 当对象被迭代器返回后会自动寻找next方法，进行迭代
    def __next__(self):
        if self.index < len(self.list):
            data = self.list[self.index]
            self.index += 1
            return data
        else:
            raise StopIteration
 
 
if __name__ == "__main__":
    mylist = MyList()
    mylist.additer("张三")
    mylist.additer("李四")
    mylist.additer("王五")
    for value in mylist:
        print(value)

实现一个斐波那契数列

class feibonaqi(object):
    def __init__(self, num):
        self.fei_list = []
        self.num = num
        self.a = 1
        self.b = 1
        self.fei_index = 0
 
    def __iter__(self):
        return self
 
    def __next__(self):
        if self.fei_index < self.num:
            data = self.a
            self.a, self.b = self.b, self.a + self.b
            self.fei_index += 1
            return data
        else:
            raise StopIteration
 
 
if __name__ == '__main__':
    fei = feibonaqi(5)
    for i in fei:
        print(i)

什么是生成器（generator）

生成器是一个特殊的迭代器，使用了 yield 的函数被称为生成器（generator）。

yield 是一个关键字，用于定义生成器函数，生成器函数是一种特殊的函数，可以在迭代过程中逐步产生值，而不是一次性返回所有结果。当在生成器函数中使用 yield 语句时，函数的执行将会暂停，并将 yield 后面的表达式作为当前迭代的值返回。然后，每次调用生成器的 next() 方法或使用 for 循环进行迭代时，函数会从上次暂停的地方继续执行，直到再次遇到 yield 语句。可以逐步产生值，而不需要一次性计算并返回所有结果。

调用一个生成器函数，返回的是一个迭代器对象。

生成器对象可以使用send()方法进行传参。

生成器中也可以使用return，当语句执行到return语句之后，生成器会终止迭代，抛出停止迭代的异常。

创建生成器的两种方式

使用推导式创建

result_list = (x * 2 for x in range(10))
print(result_list)
# 使用生成器生成一个偶数数列[0,2,4,6,8,10,12,14,16,18]
# 这边使用next先取出第一个值，后面for循环遍历出来的结果是从0后面开始的
value = next(result_list)
print(value)
 
for i in result_list:
    print(i, end=" ")

使用函数创建

def mygenerator():
    num_list = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
    num_index = 0
    while True:
        if num_index < len(num_list):
            yield num_list[num_index]
        num_index += 1
 
 
if __name__ == '__main__':
    mg = mygenerator()
    value = next(mg)
    print(value)
 
    value = next(mg)
    print(value)
 
    value = next(mg)
    print(value)

使用generator实现斐波那契数列

def feibonaqi(num):
    a = 1
    b = 1
    count_index = 0
    while count_index < num:
        data = a
        a, b = b, a + b
        count_index += 1
        yield data
 
 
if __name__ == '__main__':
    fei = feibonaqi(5)
    # data=next(fei)
    # print(data)
    # data=next(fei)
    # print(data)
    # data=next(fei)
    # print(data)
    # data=next(fei)
    # print(data)
    # data=next(fei)
    # print(data)
    for value in fei:
        print(value)

什么是协程

协程（coroutine）又称为微线程，是一种用户态的轻量级线程。

使用yield可以实现协程，yield可以终止任务执行，并记录任务执行的进度。

协程可以实现一个线程执行多个任务

协程的基本实现

import time
 
 
def work1():
    while True:
        print("正在执行work1。。。。。。。。")
        yield
        time.sleep(0.5)
 
 
def work2():
    while True:
        print("正在执行work2.....。。。。。。。。")
        yield
 
 
if __name__ == '__main__':
    w1 = work1()
    w2 = work2()
    while True:
        next(w1)
        next(w2)

使用greenlet实现协程

"""greenlet是一个第三方库可以提供自行调度的微线程，只需要告诉switch如何运行即可
    1、导入模块
    2、创建greenlet对象
    3、使用switch实现线程的调度
"""
 
import time
from greenlet import  greenlet
 
def work1():
    while True:
        print("正在执行work1。。。。。。。。")
        time.sleep(0.5)
        g2.switch()
 
 
def work2():
    while True:
        print("正在执行work2...............")
        time.sleep(0.5)
        g1.switch()
 
 
if __name__ == '__main__':
    g1 = greenlet(work1)
    g2 = greenlet(work2)
    g1.switch()

使用gevent实现协程

import time
import gevent
from gevent import monkey
 
monkey.patch_all()
"""gevent也是一个第三方库，自动调度协程，自动识别程序中的耗时操作
    使用步骤：
    1、导入模块
    2、指派任务
    g1=gevent.spawn(work1)
    g2=gevent.spawn(work2)
    3、join()让主线程等待协程进行结束后在退出
    注意：gevent默认不识别time.slepp(),识别的是gevent.sleep()
    可以使用打补丁的方式解决，猴子模块
    from gevent import monkey
    破解所有monkey.patch_all()
"""
 
 
def work1():
    while True:
        print("正在执行work1。。。。。。。。")
        time.sleep(0.5)
        # gevent.sleep(0.5)
 
 
def work2():
    while True:
        print("正在执行work2...........")
        time.sleep(0.5)
        # gevent.sleep(0.5)
 
 
if __name__ == '__main__':
    g1 = gevent.spawn(work1)
    g2 = gevent.spawn(work2)
    g1.join()
    g2.join()

进程、线程、协程的区别

进程是资源分配的基本单位、线程是CPU调度的基本单位、协程是单线程中执行多任务的方式

切换效率：协程>线程>进程
高效率方式：进程+协程

选择问题

多进程：密集CPU任务，需要充分使用多核CPU资源（服务器，大量的并行计算）的时候，用多进程
缺陷：多个进程间通信成本高，切换开销大
多线程：密集I/O任务（网络I/O、磁盘I/O、数据库I/O）使用多线程合适
缺陷：同一个时间切片只能运行一个线程，不能做到高并行，但是可以做到高并发
协程：当程序中存在大量不需要CPU的操作时（I/O），适用协程
缺陷：单线程执行，处理密集CPU和本地磁盘IO的时候，性能较低。处理网络I/O性能还是比较高的

使用协程下载网络的图片

"""
使用协程的方式将网路上的图片下载到本地
核心方法：urllib.request.urlopen()打开网址并返回对应的内容（二进制流）
"""
import urllib.request
import gevent
from gevent import monkey
 
monkey.patch_all()
 
 
def down_image(url_image, file_name):
    # 异常处理
    try:
        # 打开网络文件
        request_data = urllib.request.urlopen(url_image)
        # 打开本地文件
        with open(file_name, "wb") as file:
            # 循环读取写入文件
            while True:
                # 从网络中读取1024个字节的数据
                file_data = request_data.read(1024)
                # 判断数据是否为空，不为空就写入，为空就跳出循环
                if file_data:
                    file.write(file_data)
                else:
                    break
    except Exception:
        print("文件%s下载失败" % file_name)
    else:
        print("文件%s下载完成" % file_name)
 
 
def main():
    img_url1 = "https://img1.baidu.com/it/u=1849885514,1853800516&fm=253&fmt=auto&app=138&f=JPG?w=500&h=500"
    img_url2 = "https://img2.baidu.com/it/u=4137380440,3737943568&fm=253&fmt=auto&app=120&f=JPEG?w=1280&h=800"
    img_url3 = ("https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fsafe-img.xhscdn.com%2Fbw1%2F4e3acf5c-a0fc-44a2"
                "-99ff-94f69cae80b4%3FimageView2%2F2%2Fw%2F1080%2Fformat%2Fjpg&refer=http%3A%2F%2Fsafe-img.xhscdn.com"
                "&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1709038944&t=f8e32fd271bb9215553250f0deb5e23d")
    # joinall()将传入的线程，等待运行完成在结束进程
    gevent.joinall([
        gevent.spawn(down_image, img_url1, "img1"),
        gevent.spawn(down_image, img_url2, "img2"),
        gevent.spawn(down_image, img_url3, "img3")
    ])
 
 
if __name__ == '__main__':
    main()

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。