AI Agent(LLM Agent)入门解读

1. 什么是AI Agent?

AI Agent可以理解为一个智能体,包括感知模块、规划决策模块和行动模块,类似于人类的五官、大脑和肢体。它能帮助人类处理复杂的任务,并能根据环境反馈进行学习和调整。

五官可以理解为感知模块,大脑为规划决策模块,肢体是行动模块。如图:在这里插入图片描述
**举个例子:**用手摸了一下电线,感知模块被电麻了,此时大脑决策规划模块发出信号,把手拿走快逃。接着行动模块控制手从电线上拿开(当然也可能拿不开),这就是资料里常见的模型。将这个过程抽象出来,如图:
在这里插入图片描述
可以看到,最关键的部分就是大脑部分,即规划决策模块。以前这儿比较薄弱,只有状态、记忆,如今有了大模型,让上述框架变得强大了起来。暂时忽略感知和反馈模块,突出大模型LLM的作用,如图:
在这里插入图片描述
再将其抽取整理,如图:
在这里插入图片描述
从细节角度进行梳几个模块:

1.1 记忆模块

又分为短期记忆和长期记忆,如上下文学习就是短期记忆,一般被上下文窗口长度限制;长期记忆则保存较长时间,一般外部向量保存。注意,从某种程度上,感知也可以归类在记忆模块里,如视觉、听觉、触觉等。短期记忆如同电脑中的内存,在LLM中受到Transformer和上下文窗口长度的限制,长期记忆可以理解为硬盘,包含陈述式记忆和(如事件或事实),程序式记忆(如打字技能等)。整理后,如图:
在这里插入图片描述

1.2 规划决策模块

包含四个模块,其中,思维链和子目标分解是为了处理更为复杂的任务,反思和自我批评模块能从错误中吸取教训,提高结果质量。整理后如图:
在这里插入图片描述

1.3 工具模块

强调软件、API的调用,如日历、计算器、代码解释器、搜索等,目的是为了解决实际问题。整理后如图:
在这里插入图片描述
总计一下,当给予一个prompt,LLM记忆模块的短期记忆和长期记忆相互配合,对任务进行分解,并对错误进行反思、批评纠正,最终做出了规划决策,然后调用合适的外部工具,并最后付出行动

2. Agent与LLM之间的关系

上述过程中,GPT扮演了大脑的角色,其他模块扮演了其他的协同配合,从而突破了简单的问答工作。在这儿插播一张图:
在这里插入图片描述
是不是有些熟悉了,回到了最经典的结构,总结成公式,即:

A g e n t = L L M + 记忆 + 规划决策 + 工具使用 Agent = LLM + 记忆 + 规划决策 + 工具使用 Agent=LLM+记忆+规划决策+工具使用

3. AI Agent能起到什么实际作用

引用一个HuggingFace的案例。HuggingFace上有很多有趣的模型,一般新手不知道怎么选择模型,提出的HuggingGPT(Shen et al. 2023)就是一个AI Agent,借助ChatGPT根据描述,选择可用模型并执行。

在这个过程中包含四个阶段:

  1. 任务的规划:LLM做大脑,任务请求分为多个任务。包括任务类型、ID、依赖项和参数。
  2. 模型选择:Agent根据模型ID,选择对应模型处理用户请求。此处可以选择多个模型。
  3. 任务执行:执行特定的每个模型并记录结果。
  4. 响应生成:LLM接受执行结果,汇总至用户。

过程汇总如图:
在这里插入图片描述
这就是一个比较有趣且好玩的Agent实践案例。
类似的项目还有很多,如:ChatDev、AutoGPT、GPT-engineer

4. 如何上手学习

LLM是核心,底层是Transformer和LLaMA,搞定就ok,当然Attention可以作为知识扩展进行学习。
感知部分是多模态,涉及的就是深度学习里的强化学习。

参考

  1. 动画科普AI Agent
  2. AI Agent(或者LLM Agent)深度讲解
  3. LLM Powered Autonomous Agents
  4. AI Agent,为什么是AIGC最后的杀手锏?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/572124.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥-肖恩的排序

目录 题目链接: 思路: 代码: 总结常见的排序写法: 题目链接: 0肖恩的排序 - 蓝桥云课 (lanqiao.cn) 思路: 参考罗老师的思路:<蓝桥杯软件赛>零基础备赛20周--第8周第…

程序员如何兼职赚小钱?

程序员由于有技术和手艺其实兼职赚钱的路子还是挺多的,只要你有足够的时间。 1. 做外包 这是比较传统的方式,甲方在一些众包平台上发布开发任务,你可以抢这个任务,但是价格都比较便宜。 任务比较多的平台: 猪八戒、一品威客、开…

Leetcode70. 爬楼梯(动态规划)

Leetcode原题 Leetcode70. 爬楼梯 标签 记忆化搜索 | 数学 | 动态规划 题目描述 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?示例 1:输入:n 2 输出:2 解…

python 中判断文件、目录是否存在的方法

判断目录是否存在并创建目录 一、实现上传文件功能二、判断目录是否存在的办法2.1、使用os模块2.1.1、判断目录是否存在2.1.2、os.makedirs():递归创建目录 2.2、使用pathlib模块2.2.1、path.exist()判断目录是否存在2.2.1、path.mkdir():创建目录 2.3、…

如何利用OpenCV4.9离散傅里叶变换

返回:OpenCV系列文章目录(持续更新中......) 上一篇:如何利用OpenCV4.9 更改图像的对比度和亮度 下一篇: 目标 我们将寻求以下问题的答案: 什么是傅里叶变换,为什么要使用它?如何在 OpenCV 中做到这一点…

算法---动态规划练习-5(下降路径最小和)

下降路径最小和 1. 题目解析2. 讲解算法原理方法一方法二 3. 编写代码法一法二 1. 题目解析 题目地址:点这里 2. 讲解算法原理 方法一 首先,通过matrix的大小确定矩阵的行数m和列数n。 创建一个大小为(m1) (n2)的二维动态规划数组dp,其中d…

基于单片机的自动浇灌系统的设计

本文设计了一款由单片机控制的自动浇灌系统。本设计的硬件电路采用AT89C51单片机作为主控芯片,采用YL-69土壤湿度传感器检测植物的湿度。通过单片机将采集湿度值与设定值分析处理后,控制报警电路和水泵浇灌电路的开启,从而实现植物的自动浇灌。 1 设计目的 随着生活水平的…

南网科研院携手百度智能云,入选信通院AI原生应用优秀案例

为呈现AI原生研发和应用成效,提供AI原生相关技术、服务、部署、运营、基础设施等选型参考,近期,中国信息通信研究院发布了AI原生技术及应用优秀案例,由南方电网公司输配电部牵头、南方电网科学研究院有限责任公司(以下…

MySQL 高级语句(二)

一、子查询 1.1 相同表子查询 1.2 不同表/多表子查询 1.3 子查询的应用 1.3.1 语法 1.3.2 insert 子查询 1.3.3 update 子查询 1.3.4 delete 子查询 1.4 exists 关键字 1.4.1 true 1.4.2 false 1.5 as别名 二、视图 2.1 视图和表的区别和联系 2.1.1 区别 2.1.2 …

使用IDEA的反编译插件 反编译jar包

反编译插件介绍 安装IDEA后, 一般自带反编译插件, Java Bytecode Decompiler 如果没有可以自己安装下 1.首先找到插件的jar包, 在IDEA安装目录的plugins文件夹下 D:\IntelliJ IDEA 2021.2.2\plugins\java-decompiler\lib 2.运行java命令, 指定插件的jar包目录和你要反编译的ja…

DreamPolisher、InternLM2 、AniArtAvatar、PlainMamba、AniPortrait

本文首发于公众号:机器感知 DreamPolisher、InternLM2 、AniArtAvatar、PlainMamba、AniPortrait DreamPolisher: Towards High-Quality Text-to-3D Generation via Geometric Diffusion We present DreamPolisher, a novel Gaussian Splatting based method wit…

【C语言进阶篇】编译和链接

【C语言进阶篇】编译和链接 🥕个人主页:开敲🍉 🔥所属专栏:C语言🍓 🌼文章目录🌼 编译环境与运行环境 1. 翻译环境 2. 编译环境:预编译(预处理)编…