大模型Agent几种常见的架构设计模式

 ▼最近直播超级多,预约保你有收获

13c5e0dc8c6bc7644c072c1b880f0713.png

架构设计模式已成为程序员的重要技能。在大模型 Agent 智能体应用领域, 同样需要架构设计模式来支撑大模型应用在企业中规模的落地。

根据多年的架构设计经验,我在这里整理总结了一些针对大模型应用的设计方法和架构模式,试图应对和解决大模型应用实现中的一些挑战:推理成本问题、推迟性能延迟问题、生成幻觉问题、生成复读机等问题。

今天先来介绍最常用的 ReAct 架构设计模式

 1

ReAct 架构设计模式

ReAct 是 Reseaning 和 Action 两个词的前缀合成,代表着先推理再行动的一种架构设计模式。进一步拆解来看,ReAct 有3个重要的组成部分:Planning(规划)、Action(行动)、Observation(观测),如下图所示:

de60a0c0a54a0371e69234d5a5ac574e.png

我们先来看一个工作中的案例:马上五一长假了,你老板让你给他安排从上海去巴黎的行程,给你的预算是8K。

你收到这个任务后,

第一步:通过大脑思考给出一个 Planning(规划)的方案,从上海直飞巴黎。

第二步:需要通过去哪儿等订票网站 Action(行动)落实第一步的规划方案。

第三步:对订票 Action(行动)的过程进行观测,发现从上海直飞巴黎的机票最便宜的都需要1W+,老板给的预算不够,因此需要重新规划行程(Replanning),选择转机的方案,如下图 6990 元就够了。

b548833d92d6c15fb4de5b4f56c57cf0.jpeg

目前世界上最聪明的 Agent 就是人类,大模型 Agent 智能体是仿照人类的思维方式来完成各种任务,因此大模型 Agent 智能体同样需要 ReAct 的 Planning-Action-Observation 三步架构落地方式。

 2

ReAct 架构设计模式代码实现

大模型 Agent 智能体的 ReAct 架构设计模式本质是将人类的思维、做事方式以 Prompt Engineering 的方式告诉大模型进行规划、并调用工具完成执行、形成 Run Loop 循环持续迭代直到完成对应的任务。

推荐 Sam Witteveen 开源的 ReAct 的架构设计实现,Github 地址如下:https://github.com/samwit/langchain-tutorials/blob/main/agents/YT_Exploring_ReAct_on_Langchain.ipynb

代码结构主要有以下几步:

第一步:生成提示词。

将代码中预设好 ReAct 的提示词模板(格式:Quesion->Thought->Action->Observation)和用户的问题进行合并。

第二步:调用大模型生成 Thought + Action。

将 Few-shot 少样本提示词发给大模型,大模型生成一堆 Thought、Action 和 Observation,我们并不希望大模型输出 Observation。因此在代码里通过 Stop.Observation 来控制大模型遇到 Observation 后停止输出,最后大模型仅仅返回 Thought 和 Action。

第三步:调用外部工具(API)完成执行。

获得 Action 后,若非 “Finish” 状态,大模型将运用其 Function Calling 能力,即将 Action 中的自然语言转化为对应外部工具可理解的 API 调用。此功能本质上是对大模型进行微调以实现语言到 API 接口格式的精准转换。

第四步:生成 Observation。

API 接口响应数据接收后,系统会将其转化为自然语言表述,形成Observation。接着,将新生成的 Observation 与先前的 Thought 及当前非“Finish”的 Action 一并提交给大模型,继续执行步骤2(Thought 生成)与步骤3(Action 转化及执行)。这一循环将持续进行,直到接收到 Action为 “Finish” 为止。

第五步:完成输出。

在流程结束时,最后一个 Observation 会被转化为易于理解的自然语言表述,然后呈现给用户,作为整个交互过程的最终输出结果。

为了帮助同学们彻底掌握大模型 Agent 智能体、知识库、向量数据库、 RAG、知识图谱的应用开发、部署、生产化,今天我会开两场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

 3

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

4c31c6c965c534d096584cfcad5bb92a.gif

9e14d1b652b6501eb74080982e1cdf75.png

本期名额有限

高度起始于速度(手慢无!!)

 4

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

095695e841adc5ec8cd0ce236e1648ae.png

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

eea2595dda43446a6a7eede3cece39c7.png

第二步:扫码后,点击以下关注按钮,就可关注我。

3946a695d12a10e6e2981aecd0505752.jpeg

第三步:点击"客服“按钮,回复知识图谱即可领取。

144b1451c2a1dd0f4c7919ff2370c2b5.jpeg

 5

精选福利《知识库上下文丢失问题解决》

以下视频你将学到:

    1、知识库为什么会有上下文丢失的问题

    2、知识库上下文丢失如何解决?

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/641400.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI大模型探索之路-认知篇3:大语言模型微调基础认知

文章目录 前言一、微调技术概述二、微调的必要性三、大模型的微调方法四、微调过程中的技术细节五、微调后的模型评估与应用总结 前言 在人工智能的广阔研究领域内,大型预训练语言模型(Large Language Models, LLMs)已经成为推动技术革新的关…

如何训练一个大语言模型(LLMs)

目录 前言大语言模型 Vs机器学习模型训练过程步骤1:数据策划(Data Curation)步骤2:格式化与预处理步骤3:训练模型步骤4:模型评估 LLM Leaderboard[LLM Leaderboard 2024](https://www.vellum.ai/llm-leaderboard)[Open…

crmeb的分销推广如何用

CRMBE分销推广说明 1、CRMEB分销模式 分销模式: 指定分销、人人分销、满额分销 指定分销: 用户默认无分销权限,需要后台开通分销权限后,才可以通过推广下级获得返佣; 人人分销: 用户在商城注册后自动获得分…

javaScript中的执行栈和执行上下文

执行上下文 执行上下文,英文全称为 Execution Context,一句话概括就是“代码(全局代码、函数代码)执行前进行的准备工作”,也称之为“执行上下文环境”。 运行JavaScript代码,当代码执行进入一个环境时&a…

COZY: Stylized Weather 3

远离枯燥的现实主义,一个精美手工制作的程式化天气系统。 从一天中的不同时间到一年中的不同季节,从蓬松的云朵到狂风暴雨,从晴朗的日子到浓雾弥漫,COZY都能轻松做到! ✅ 3.0中的新功能 HDRP支持 物理上精确的月球系统 8K 星形纹理 新的豪华云风格融合了纹理,创造出高性…

Facebook的区块链应用深度分析

去中心化身份验证的意义 在当今数字化社会中,身份验证的重要性不言而喻。对于Facebook这样的大型社交媒体平台来说,确保用户的身份真实性和数据的安全性是至关重要的。传统的中心化身份验证方式存在一定的安全风险和可信性问题,而去中心化身…

5款小伙伴们私信推荐免费软件

​ 最近后台收到好多小伙伴的私信,今天继续推荐五款小工具,都是免费使用的,大家可以去试试看。 1. 数据恢复工具——EaseUS Data ​ EaseUS Data是一款高效的数据恢复软件,能够恢复因各种原因丢失的文件,如误删除、格…

Redis入门到通关之数据结构解析-ZipList

文章目录 ☃️概述☃️ZipListEntry☃️Encoding编码☃️ZipList的连锁更新问题☃️总结 欢迎来到 请回答1024 的博客 🍓🍓🍓欢迎来到 请回答1024的博客 关于博主: 我是 请回答1024,一个追求数学与计算的边界、时间与…

街子智勇传媒,盼你知错即改

今天本“人民体验官”推荐人民日报官方微博文化产品《请相信:读书是通向世界最好的路》。 图:来源“人民体验官”推广平台 “不读书,天地辽阔内心犹在井底。”这话说得入木三分! 这话让笔者立即联想到自己最近发表的戏作打油诗《…

RF高频腔设计(6)

为了在最小功率损耗的情况下得到最大的加速电压,我们需要最大化分路阻抗(shunt impedance)。 由公式 R ( R Q ) Q R\left(\frac{R}{Q}\right)Q R(QR​)Q 可知道,如果增加分路阻抗的大小,可以通过提高Q,或…

在数字化转型过程中,企业的资产管理需要做出哪些调整?

在数字化转型过程中,企业的资产管理做出调整的常见于以下几个方面: 1、提高工作效率:数字化转型能够让员工在部门与部门之间的沟通更加顺畅,节省时间,提高效率。这要求企业在资产管理中采用数字化工具和流程&#xff…

得帆云X银雁科技,低代码将在数字化转型中发挥更大作用

1996年,银雁科技服务集团股份有限公司于深圳成立,服务网络覆盖全国200多个城市。在科技服务领域深耕二十余年,以数字技术基础服务设施,为客户提供业务流程服务,基于多维度的产品组件,可根据不同行业客户需求…