浅谈AI Agent的理解
Agents是什么?
大语言模型可以接收输入、可以分析&推理、可以输出文字、代码、媒体。然而其无法像人类一样,拥有规划思考能力、运用各种工具与物理世界互动,以及拥有人类的记忆能力。
AI Agents是基于LLM能够自助理解、自主规划决策、执行复杂任务的智能体。
Agent的设计目的是为了处理那些简单的语言模型可能无法处理解决的问题,尤其是当这些任务涉及到多个步骤或者需要外部数据源的情况。
LLM: 接受输入、思考、输出
人类: (接受输入、思考、输出) + 记忆 + 工具 + 规划 -----> Agents
一、Agents 工作流
规划(Planning):智能体会把大型任务分解为子任务,并规划执行任务的流程;智能体会对任务执行的过程进行思考和反思,从而决定是继续执行任务,或判断任务完结并终止运行。
记忆(Memory):短期记忆(Short-tgerm-memory),是指在执行任务过程中的上下文,会在子任务的执行过程产生和暂存,在任务完结后被清空,长期记忆(Long-term-memory)是长时间保留的信息,一般指外部知识库,通常用向量数据库来存储和检索。
工具使用:为智能体配备工具API,比如:计算器、搜索工具、代码执行器、数据库查询工具等...有了这些工具API,智能体就可以是物理世界交互,解决世界的问题。
二、Agents 决策流程图