AI智能体技术突破:引领科技新浪潮

AI智能体技术突破:引领科技新浪潮

    • 基于大模型的 AI Agent 工作流
    • 基于大模型的 AI Agent 工作流效果
    • AI Agent 的四种设计模式
      • Reflection 反思设计模式
      • Tool use 工具使用设计模式
      • Planning 规划设计模式
      • Multiagent collaboration 多智能体协作设计模式

在这里插入图片描述

吴恩达在红杉美国 AI 峰会上分享了他对 AI Agent 智能体的看法,主要包括以下 3点:基于大模型的 AI Agent 工作流、AI Agent 工作流效果、AI Agent 的四种设计模式。

基于大模型的 AI Agent 工作流

我很期待与大家分享我在 AI Agent 智能体中看到的令人兴奋的趋势,我认为每个 AI 从业者都应该关注这个趋势。

目前,我们使用大语言模型的主要方式是一种非智能体工作流程,即您输入一个提示词,大模型就生成一个回答。这有点像让一个人坐下来一次性从头到尾编写一篇文章,而不允许使用退格键,尽管这样做很难,但大模型的表现出奇地出色。

相比之下,AI Agent 智能体工作流程看起来是这样的(如下图右边所示):一个 AI 大模型,我们让它写一份论文大纲。需要上网查资料吗?如果需要,就联网。然后写初稿、读初稿,并思考哪些部分需要修改。继续修改初稿并推进。
在这里插入图片描述
很多人没有意识到,这种做法可以带来显著的改进效果。我自己在使用这些代理工作流程时也感到非常惊讶,它们工作得如此之好。

总之,这种有迭代反思的做法会带来显著的改进效果。

基于大模型的 AI Agent 工作流效果

比如:给定一个非空整数列表,返回位于偶数位置的所有奇数元素的和。大模型生成的答案是像这样的代码片段(如下图所示):

在这里插入图片描述

事实证明,如果你使用 GPT-3.5,在零样本提示的条件下,GPT-3.5 的准确率是 48%。GPT-4 要好得多,达到了 67%。但如果你采用的是 AI Agent 智能体工作流,并将其打包,GPT-3.5 实际上能表现更好,甚至比 GPT-4 还好。

如果你围绕 GPT-4 构建这样的工作流,GPT-4 也能表现得很好。注意,处于AI Agent 智能体工作流中的 GPT-3.5 实际上优于 GPT-4。这是一个信号

在这里插入图片描述
解释一下上图:Reflection、Tool Use、Planning、Multiagent 是吴恩达提到的四种 Agent 设计模式,后续会详细介绍。

其实基于 Agent 的工作流程才符合人类的习惯,毕竟对于一段复杂的程序,没有一个程序员是从头写到尾的,一般都是先能跑通,然后不断优化重构,补充异常处理,持续迭代优化的过程。

AI Agent 的四种设计模式

Reflection 反思设计模式

很好理解,如果你让大模型写一段代码,它会立马给你一个反馈。这时候你可以将它输出的代码片段再输入回去,让大模型仔细检查它写的代码的准确性、结构规范性等,并且给出评论。

然后再将这些反馈结果输入给大模型,它可能会输出一个比第一版更好的代码。

在这里插入图片描述
我之前描述的是一个单一的编码 AI Agent 智能体 ,你提示它与自己进行交互。这个想法的一种自然延伸是,不是单一的代码 AI Agent 智能体 ,而是有两个AI Agent 智能体,一个是编码 AI Agent 智能体 ,另一个是评审 AI Agent 智能体 。它们可以基于同一个语言模型,但你以不同的方式对它们进行提示,对一个说“你是专业编码者,编写代码”,对另一个说"你是专业代码评审员,评审这段代码"。这种工作流程实际上非常容易实现,我认为它是一种通用技术,可以为很多工作流程带来显著的大语言模型性能提升。

Tool use 工具使用设计模式

相信大家使用 Copliot,或者月之暗面的 Kimi Chat,你给出 Prompt 提示词,它首先会检索互联网上的内容,基于检索到的内容进行总结分析,给出结论。

这个其实就是大模型使用「网页搜索」工具的例子。

再比如:你问大模型,今天的天气如何?这个时候大模型会调用天气预报工具得到今天的的天气状况。

在这里插入图片描述

Planning 规划设计模式

在我进行的一些现场演示中,有些演示会失败,AI Agent 智能体会重新规划路径。我经历过很多这样的时刻。其中一个例子是从 HuggingGPT 论文中改编的,输入的是:请生成一张图片,一个女孩在看书,她的姿态和图像中的男孩一样,再使用你的声音描述这张新图片。

在这里插入图片描述
今天有了 AI Agent 智能体,你可以确定第一件要做的事是确定男孩的姿态,提取姿态。接下来需要找到一个姿态图像模型,遵循指令生成一张女孩的图像。然后使用图像 - 文本模型得到描述。最后使用文本转语音模型读出描述。

Multiagent collaboration 多智能体协作设计模式

多智能体协作,这部分很很有趣,比你想象的好很多,类似于之前大火的 AI 斯坦福小镇。
在这里插入图片描述
吴恩达举的例子是开源项目 ChatDev,你可以让一个大模型扮演不同的角色,比如:公司CEO、设计师、产品经理或测试人员,这些 Agents 会相互协作,共同开发一个 App 或者复杂程序。

虽然不是每次都能成功,但有时确实非常惊艳!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/625509.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

4.16

1.总结keil5下载代码和编译代码需要注意的事项 1.)仿真器设置: 点击魔术棒,选择debug选项,找到使用的仿真器,选择ST-LINK仿真器,点击setting,选择flash download ,勾选reset and run,选择pack…

网络协议——IS-IS协议详解

1. IS-IS是什么 IS-IS是一种基于链路状态并使用最短路径优先算法进行路由计算的一种IGP协议。IS-IS属于内部网关协议,用于自治系统内部。IS-IS是一种链路状态协议,使用最短路径优先算法进行路由计算。 2. 应用场景(园区网和骨干网&#xff0…

工业物联网让“制造”变成“智造”!——青创智通

工业物联网解决方案-工业IOT-青创智通 随着科技的不断进步和工业的持续发展,物联网(IoT)技术的出现为制造业带来了前所未有的变革。工业物联网(IIoT)作为物联网技术在工业领域的应用,正在逐渐改变传统的制…

基于springboot实现图书进销存管理系统项目【项目源码+论文说明】

基于springboot实现图书进销存管理系统演示 摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了图书进销存管理系统的开发全过程。通过分析图书进销存管理系统管理的不足,创建了一个计算机管理图书进销…

葡萄书--深度学习基础

卷积神经网络 卷积神经网络具有的特性: 平移不变性(translation invariance):不管检测对象出现在图像中的哪个位置,神经网络的前面几层应该对相同的图像区域具有相似的反应,即为“平移不变性”。图像的平移…

QQ怎么录制视频?教你简单几步,轻松录制高清视频

在当今互联网时代,录制视频已经成为人们日常生活中越来越常用的功能。qq录屏作为qq软件内置的一个功能,凭借其便捷性和易用性受到广大用户的喜爱。但是,很多人不知道qq怎么录制视频。本文将深入研究qq录制视频功能,以便读者根据自…

5-pytorch-torch.nn.Sequential()快速搭建神经网络

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言torch.nn.Sequential()快速搭建网络法1 生成数据2 快速搭建网络3 训练、输出结果 总结 前言 本文内容还是基于4-pytorch前馈网络简单(分类&#xf…

南京大学田兴军团队在土壤微生物的功能类群以及在中国土壤生态系统的分解潜力取得进展(两篇)

研究成果一:土壤微生物群落功能是由占据不同生态位的、高度多样化的微生物之间发生的复杂相互作用决定的。这些微生物相互作用对环境变化的反应敏感,并且往往在土壤“暗箱”中悄然发生,故极大地限制了我们对微生物功能的理解。本研究基于微生…

【DM8】ODBC

官网下载ODBC https://www.unixodbc.org/ 上传到linux系统中 /mnt下 [rootstudy ~]#cd /mnt [rootstudy mnt]# tar -zxvf unixODBC-2.3.12.tar.gz [rootstudy mnt]# cd unixODBC-2.3.12/ [rootstudy unixODBC-2.3.12]# ./configure 注意:若是报以上错 则是gcc未安…

文件服务: txt文件预览乱码问题

文章目录 一、背景二、解决方案1、转换流(解决代码与文件编码不一致读取乱码的问题)2、获取文本文件的字符编码 一、背景 在springboot项目中使用springmvc web.resources的形式进行文件访问。本地上传txt文件编码格式为GB2312(中文简体),浏…

【蓝桥杯嵌入式】串口通信与RTC时钟

【蓝桥杯嵌入式】串口通信与RTC时钟 串口通信cubemx配置串口通信程序设计 RTC时钟cubemx配置程序设计 串口通信 cubemx配置 打开串口通信,并配置波特率为9600 打开串口中断 重定义串口接收与发送引脚,默认是PC4,PC5,需要改为P…

计算股价波动率python

上述图片上传gemini,提问:转换为python代码 好的,以下是您发送的图像中公式的 Python 代码: python def stock_volatility(prices, opening_prices, N): """ 计算股票价格的波动率。 参数: p…