Python 代码中的 yield 到底是什么?

news/2024/11/15 17:28:12/文章来源:https://www.cnblogs.com/zhuuque23/p/18328757

在Python编程中,有一个强大而神秘的关键字,那就是yield。初学者常常被它搞得晕头转向,而高级开发者则借助它实现高效的代码。到底yield是什么?它又是如何在Python代码中发挥作用的呢?让我们一起来揭开它的面纱。

Python里的一个非常重要但也颇具迷惑性的关键词——yield

什么是yield?为什么我们需要在Python中使用它?

 

 

来,让我们一起来拆解一下,看看yield到底是个啥。

 

 

迭代与可迭代对象

 


要搞明白yield,咱们先得弄清楚什么是可迭代对象(iterables)。

所谓可迭代对象,简单来说,就是你可以逐个读取其元素的对象,比如列表、字符串、文件等等。举个例子,当你创建一个列表时,你可以用for循环一个个地读取它的元素:

mylist = [1, 2, 3]
for i in mylist:
print(i)

 

输出会是:

1
2
3

 

这里的mylist就是一个可迭代对象。你还可以用列表推导式(list comprehension)来创建一个列表,它同样也是可迭代的:​​​​​​​

mylist = [x*x for x in range(3)]
for i in mylist:
print(i)

 

输出是:​​​​​​​

0
1
4

 

凡是你可以用for... in...来操作的东西,都是可迭代对象,包括列表、字符串、文件等等。

可迭代对象非常方便,因为你可以任意多次地读取它们的值,但前提是你得把所有值都存储在内存里。这就带来了一个问题:当数据量很大时,这种方式显然不太合适。

 

生成器

 


生成器(generators)是迭代器的一种,你只能遍历它们一次。生成器不像列表那样把所有的值都存储在内存里,而是即用即生成。来看看生成器的例子:​​​​​​​

mygenerator = (x*x for x in range(3))
for i in mygenerator:
print(i)

 

输出和列表推导式一样:​​​​​​​

0
1
4

 

但注意了,生成器只能使用一次,因为它们会“边用边忘”:计算0后忘记0,计算1后忘记1,最后计算4后结束。再用同一个生成器对象做for循环就没有结果了。

 

 

 

 

yield关键词

 


说到yield,这是个类似于return的关键词,但它返回的不是一个值,而是一个生成器。看看这个例子:​​​​​​​

def create_generator():
mylist = range(3)
for i in mylist:
yield i*i

mygenerator = create_generator() # 创建一个生成器
print(mygenerator) # mygenerator 是一个生成器对象!

 

输出是:

<generator object create_generator at 0xb7555c34>

 

通过for循环遍历这个生成器:​​​​​​​

for i in mygenerator:
print(i)

 

输出:​​​​​​​

0
1
4

 

这个例子看起来简单,但它在处理大量数据时特别有用,因为生成器只在需要时生成值,而不是一次性生成所有值然后存储在内存中。

 

 

深入理解yield

 


为了彻底掌握yield,我们需要理解当调用生成器函数时,函数体内的代码并不会立即执行。函数返回的是一个生成器对象,然后你的代码会在每次调用for循环时从上次中断的地方继续执行,直到遇到下一个yield。

 

第一次调用for循环时,生成器对象会从头开始运行函数中的代码,直到遇到yield,然后返回循环中的第一个值。随后的每次调用都会执行函数中循环的下一次迭代,直到生成器不再有值返回。这可能是因为循环结束了,或者条件不再满足。

 

来看看一个实际的例子:​

1 def _get_child_candidates(self, distance, min_dist, max_dist):
2     if self._leftchild and distance - max_dist < self._median:
3         yield self._leftchild
4     if self._rightchild and distance + max_dist >= self._median:
5         yield self._rightchild

 

这里的代码在每次使用生成器对象时都会被调用:

 

如果节点对象还有左子节点并且距离合适,返回下一个子节点。

如果节点对象还有右子节点并且距离合适,返回下一个子节点。

如果没有更多子节点,生成器会被认为是空的。

 

调用这个生成器的方法如下:​​​​​​​

 

1 result, candidates = list(), [self]
2 while candidates:
3     node = candidates.pop()
4     distance = node._get_dist(obj)
5     if distance <= max_dist and distance >= min_dist:
6         result.extend(node._values)
7     candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))
8 
9 return result

 

这里的代码有几个巧妙之处:

 

  • 循环遍历一个列表,而列表在循环过程中会扩展。这样可以方便地遍历所有嵌套的数据,虽然有些危险,因为可能会陷入无限循环。在这个例子中,candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))用尽生成器的所有值,但while循环不断创建新的生成器对象,因为它们作用在不同的节点上会产生不同的值。
  • extend()方法是列表对象的方法,它期望一个可迭代对象,并将其值添加到列表中。通常我们传递一个列表给它,但在代码中,它接收一个生成器,这是个好主意,因为:
  • 你不需要读取值两次。
  • 你可能有很多子节点,不想全部存储在内存中。

 

这段代码展示了Python为何如此酷:它不在乎方法的参数是列表还是其他可迭代对象。这种特性叫鸭子类型(duck typing),也是Python灵活性的一个体现。

 

高级用法

 


再来看一个更高级的用法——控制生成器的耗尽:​​​​​​​

 

 1 class Bank():
 2     crisis = False
 3     def create_atm(self):
 4         while not self.crisis:
 5             yield "$100"
 6 
 7 hsbc = Bank()
 8 corner_street_atm = hsbc.create_atm()
 9 print(next(corner_street_atm)) # 输出 $100
10 print(next(corner_street_atm)) # 输出 $100
11 print([next(corner_street_atm) for _ in range(5)]) # 输出 ['$100', '$100', '$100', '$100', '$100']
12 
13 hsbc.crisis = True
14 print(next(corner_street_atm)) # 输出 StopIteration

 

这里我们模拟了一个ATM机,在银行没有危机时,你可以不断取钱,但一旦危机来了,ATM机就会停止工作,即使是新的ATM机也不能再取钱了。

 

itertools模块

 


最后,给大家介绍一个非常有用的模块——itertools。这个模块包含了很多操作可迭代对象的特殊函数。如果你曾经希望复制一个生成器、连接两个生成器、用一行代码将值分组到嵌套列表中,或者在不创建另一个列表的情况下使用map和zip,那么就应该导入itertools。

举个例子,我们看看四匹马比赛的可能到达顺序:​​​​​​​

import itertoolshorses = [1, 2, 3, 4]
races = itertools.permutations(horses)
print(list(itertools.permutations(horses)))

 

输出:

[(1, 2, 3, 4), (1, 2, 4, 3), (1, 3, 2, 4), (1, 3, 4, 2), (1, 4, 2, 3), (1, 4, 3, 2), (2, 1, 3, 4), (2, 1, 4, 3), (2, 3, 1, 4), (2, 3, 4, 1), (2, 4, 1, 3), (2, 4, 3, 1), (3, 1, 2, 4), (3, 1, 4, 2), (3, 2, 1, 4), (3, 2, 4, 1), (3, 4, 1, 2), (3, 4, 2, 1), (4, 1, 2, 3), (4, 1, 3, 2), (4, 2, 1, 3), (4, 2, 3, 1), (4, 3, 1, 2), (4, 3, 2, 1)]

 

itertools模块简直是Python程序员的好伙伴,可以让你在处理迭代对象时如虎添翼。

 

总结

 


yield是Python中一个强大的工具,它可以帮助你以一种高效的方式处理大量数据。理解yield的工作原理对于掌握Python编程至关重要。

在大数据时代,处理海量数据已成为常态。生成器作为一种高效的数据处理方式,因其优越的内存管理能力,受到了越来越多开发者的青睐。无论是日志处理、数据流分析,还是实时数据处理,生成器都展现了不可替代的价值。

通过对yield的详解,我们不仅理解了它的基本概念和用法,还认识到它在高效数据处理中的重要性。掌握yield,将为你的Python编程之旅增添一把利器。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/773159.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智能家居如何把老款定频空调变成智能“变频”空调#米家#智能家居#HA

背景最近长沙的天气暴热,室内达到了34-35度,天气预报最高温度上了40度,这么酷热的天气,离开了空调,基本上就是一身汗,全身湿透,特别难受,然后不得不开启家里的一台将近10年的老式定频空调,输入功率970W,OMG,一小时将近一度电,假设一天吹10小时,就是10度电,一个月…

联想电脑 win11系统,关闭联想锁屏后,windows聚焦不生效(其他电脑同理)

先排查下前置条件,然后再使用解决方案。附加:如何关闭联想锁屏: 打开联想电脑管家->工具箱->联想锁屏->关闭排查 原因1:是不是使用clash代理导致的联网问题。 解决:在clash启动"UWP应用联网限制解除工具"助手,全选,保存,等待一阵即可以正常更新屏保…

imbalanced-learn库的作用和安装

imbalanced-learn是一个Python库,‌专门用于处理不平衡数据集的机器学习问题。‌ 这个库提供了一系列的重采样技术、‌组合方法和机器学习算法,‌旨在提高在不平衡数据集上的分类性能。‌Imbalanced-learn支持欠采样、‌过采样、‌结合欠采样和过采样的方法,‌以及一些集成学…

gorm中使用乐观锁

乐观锁简介 乐观锁(又称乐观并发控制)是一种常见的数据库并发控制策略。乐观并发控制多数用于数据竞争(data race)不大、冲突较少的环境中,这种环境中,偶尔回滚事务的成本会低于读取数据时锁定数据的成本,因此可以获得比其他并发控制方法更高的吞吐量。 它的作用是防止并发更…

lapce源码学习-启动过程

一、记录日志 1.1、panic恐慌(异常)记录跟踪 调用堆栈,如果有源代码信息时,则记录文件路径、行、列、堆栈;否则仅记录堆栈。 window系统,调用win32接口弹出模态框窗口提醒。1.2、链路追踪日志,输出到文件和控制台配置 文件:文件数目、文件前缀/后缀名、文件收集各目标日…

模块3 面向对象编程高级 --- 第十一章:异常处理

第十一章 异常处理 主要知识点1、异常产生的原因2、标准异常类3、Java的异常处理机制4、异常的创建5、异常的抛出6、异常语句的编程 学习目标熟悉异常产生的原因和标准异常类的用法。能够运用异常处理机制编写Java程序,提高安全性; 11.1 异常的分类一旦出现异常,系统将会立刻…

Win10资源管理器文件夹错乱

昨天晚上我不知道怎么搞得,鼠标在资源管理器界面,我手放在触控板上,不知道拖拽了啥,把所有文件搞到桌面文件夹下了。然后焦虑了一天,都打算从还原点还原了,然后今天早上更新了Windows,发现最新的还原点就在今早。。。无奈之下想到了去问问ChatGPT,然后居然它真的给了我…

[Redis]原子性

事务 为了确保连续多个操作的原子性,一个成熟的数据库通常都会有事务支持,Redis也不例外。 Redis的事务使用方法非常简单 不同于关系数据库我们无须理解那么多复杂的事务模型就可以直接使用。不过也正是因为这种简单性它的事务模型很不严格这要求我们不能像使用关系数据库的事…

[米联客-安路飞龙DR1-FPSOC] FPGA基础篇连载-01 软件工具环境搭建

软件版本:Anlogic -TD5.9.1-DR1_ES1.1 操作系统:WIN10 64bit 硬件平台:适用安路(Anlogic)FPGA 实验平台:米联客-MLK-L1-CZ06-DR1M90G开发板 板卡获取平台:https://milianke.tmall.com/ 登录"米联客"FPGA社区 http://www.uisrc.com 视频课程、答疑解惑! 1代码编…

【Python】Django学习1

按黑马程序员的美多商场作方向:https://www.bilibili.com/video/BV1nf4y1k7G3一、应用创建、注册处理、配置 Pycharm 创建Django项目: 自应用注册处理: 二、应用数据初始化 第一步:创建元数据初始化py脚本python manage.py makemigrations初始化的脚本会放在各个自应用的…

catboost库作用与安装

CatBoost是一种机器学习库,‌由俄罗斯的搜索巨头Yandex在2017年开源。‌它属于Boosting族算法的一种,‌与XGBoost、‌LightGBM并称为GBDT的三大主流神器。‌CatBoost的主要作用和创新点在于高效合理地处理类别型特征,‌这是从其名称中的"Cat"(‌分类)‌和"…

xgboost的作用与库的安装

XGBoost是一个非常强大的Boosting算法工具包,‌以其优秀的性能(‌效果与速度)‌在数据科学比赛中长期占据领先地位,‌并且在许多大厂的机器学习方案中也是首选模型。‌ XGBoost在并行计算效率、‌缺失值处理、‌控制过拟合、‌预测泛化能力等方面表现出色。‌它的主要特点和…