Claude 3 on Amazon Bedrock 结合多智能体助力 Altrubook AI 定义消费者 AI 新范式

e9bfb6068078f0aaf9ab1f39b3414b38.gif

关于 Altrubook AI

智能消费决策机器人

Altrubook 是全球首创场景化智能决策机器人,由国内外大厂等前员工共同研发,具有定制化 IP 决策机器人、沉浸式购物体验和需求匹配优化等独特优势。目前,Altrubook AI 已完成与 Claude 3 on Amazon Bedrock 的深度技术融合,将 Claude 3 卓越的多模态对话能力与 Altrubook AI 的领域决策模型无缝集成。凭借先进的人工智能算法,它可在创建的虚拟购物场景中,与用户进行身临其境的对话互动,智能捕捉消费诉求,给出高度个性化和情感化的商品推荐,并综合多重参数为用户规划出性价比最优的一揽子采购方案。Altrubook AI 将颠覆传统购物体验,为消费者带来前所未有的智能决策服务。它不仅能最大限度匹配消费需求,更能自动消除信息不对称,消弭买卖双方的利益鸿沟,为跨境电商及中小独立站商提供全新高效的销售渠道。

Altrubook AI 的开发公司——南京阿尔特科技是一家专注于电商消费领域模型与人工智能算法的高科技公司,由一支梦想远大的国际化科技精英团队组建而成,他们正在开启一场令人鼓舞的科技探索之旅,竭力打造世界一流的智能决策机器人产品和服务,让人工智能为人类消费决策加冕,开创智慧经济的新纪元。

关于

Claude 3 on Amazon Bedrock

2024 年 3 月,Anthropic 宣布推出 Claude 3,这是新系列的先进人工智能模型。该系列允许客户根据自身业务需求精确选择智能水平、速度和成本的组合。该系列包括三个模型:

  • Claude 3 Haiku:作为系列中最快、最紧凑的模型,可实现近乎即时的响应;

  • Claude 3 Sonnet:平衡了智能和速度的理想模型;

  • Claude 3 Opus:在高度复杂的任务上能够实现更出色性能的高智能模型。

性能提升:在速度方面,Claude 3 取得了显著提升。对于大多数工作负载而言,其处理速度是 Claude 2 的两倍,同时保持了相同的智能水平。

增强的可操纵性:对人工智能系统可操纵性的提升,使用户能够更有效地控制输出,以期获得更可预测且高质量的结果。

图像到文本的视觉能力:Claude 3 拥有处理图像并生成文本输出的视觉能力。它特别擅长分析和理解图表、图形、技术绘图、报告和其他视觉资料。

目前,Claude 3 系列 Haiku、Sonnet 模型已经可以在 Amazon Bedrock 中使用。

Altrubook 场景运用

由于商品种类繁多、信息海量,很多用户在选购过程中常常会感到无所适从,难以权衡商品的性价比。为了解决这一痛点,Altrubook 创新性地引入了基于 LLM 的 Multi-agent 系统。通过应用 Multi-agent 框架与 Altrubook 自研的领域决策大模型(Domain-specific Large Language Model, DSLLM)以及 Claude 3 的多模态能力,Altrubook AI 为消费者提供高效率且个性化的购物决策,大幅提升消费者的购物体验。

生成式 AI 在消费决策方案的

技术实现

7e68312aea9eefef07952eead4f383ba.png

1. Multi-agent 构建智能购物新范式

对于用户目标商品的信息差,通过应用 LLM 智能体技术,Altrubook 的信息获取过程更加人性化和智能化,提高了效率和准确性。智能体能够像人一样思考和推理,根据目标自主地收集和处理信息,而不是被动执行预定义的程序,这种创新方法有助于更好地满足用户的信息需求。

在 Altrubook 中,有很多个智能体(Multi-agent),这些智能体能够像人一样思考和推理,根据既定目标自主地收集和处理信息,而不是被动执行预定义的程序,并被组织成了两个团队。

信息搜索团队(Information Retrieval Agents Team, IRAT):该团队由搜索智能体(Searcher Agent)、网页抓取智能体(Web scrape Agent)、以及语义解析智能体(Semantic Parsing Agent, SPA)组成,它们分工协作,从搜索引擎、电商平台、社交媒体等多个渠道获取与用户查询相关的原始数据,利用 BERT 模型对商品信息、用户评论等非结构化文本进行语义解析,提取关键实体、属性和情感倾向,通过 Claude 3 获取视觉信息,包括外部图片、用户浏览图片等,并将其转化为结构化的信息单元。

模拟用户团队(Pretending User Agents Team, PUAT):该团队由 Inpersonating User Agent、Inpersonating Male user Agent 和 Inpersonating Female Agent 等不同的智能体组成。他们扮演着虚拟用户的角色,根据 Altrubook LLM 生成的用户画像,模拟不同属性和偏好的用户行为,并与信息搜索团队进行交互,帮助搜集和筛选出更加符合目标用户特征的信息。

Supervisor 团队(Altrubook Supervisor Agent, ASA):作为整个 Altrubook 系统的调度中心,Altrubook Supervisor 负责协调各个智能体之间的工作流程和信息传递。它接收来自用户的查询请求,并将其分解为多个子任务分配给不同的智能体团队。同时,它还负责汇总和整合各个智能体返回的结果,并将其传递给 Altrubook DSLLM 进行最终的决策生成。

e48a6ddbe82ea4ed6ee53eafb8bc7e8d.png

整个架构依据“ReAct”的思想构建,“ReAct”一词源于《REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS》,它由单词“Reason”和“Act”组合而成,对于某个特定的问题,使用不同的大语言模型,以区分“逻辑推理”和“执行行动”的方法,从而在两者之间实现更强的协同效应。

Act Agent:Searcher Agent(搜索智能体),Web scrape Agent(网页抓取智能体) 主要负责从外部环境中获取信息和知识,为 Reasoner 提供原始数据,它们扮演着“感知”和“行动”的角色。

Reasoner Agent (Altrubook DSLLM, Claude 3) 则通过语言模型的推理能力,分析 Act Agent 获取的信息,生成针对性的决策和反馈。

Altrubook Supervisor 作为整个系统的核心控制单元,负责协调各个模块之间的工作流程。它接收来自用户的请求,对任务进行分解,并动态调度 Act Agent 和 Reasoner Agent 完成任务。Altrubook Supervisor 通过对全局信息的掌握和宏观调度,实现了 Reason 和 Act 的有机结合,构建了一个“Reason+Act”的完整智能体系。

智能体工作流:

f26d36406718e9a9d417312104a53772.png

2. 借助 Claude 3 模型,使 Multi-agent 具备视觉洞察能力

利用先进的多模态大模型 Claude 3 对获取的信息进行判定和总结,将多智能体获取的目标信息,包括文本、图像等多模态数据作为输入提示词,通过 Claude 3 on Amazon Bedrock Message API 传递给 Claude 3 大模型。凭借其强大的多模态理解能力,Claude 3 能够深入理解图像内容,并结合文本信息进行全面的判定和总结。通过这样基础信息融合多模态的分析方式,能够提供更加准确、全面的信息判断,为后续的智能决策提供视觉支撑。

ea53fd98551752cf4720d8b7f97e61e9.png

部分 Prompt 参考:

04cc7f593b77b254cb96bc50a8807ad0.png

这个 prompt 要求 Claude 以分析师的角度,从提供的商品图片中提取颜色、品牌、品类,以及判断图片是否有提供额外的折扣信息。

3. Altrubook 领域决策大模型,最终生成可供消费者决策的方案

基于判断结果和综合信息总结,Altrubook 的领域决策大语言模型(Domain-specific Large Language Model, DSLLM)将依据信息生成最佳个性化方案,为用户提供最优的购物决策建议。

Altrubook DSLLM:作为核心大脑,Altrubook DSLLM 接收来自 Supervisor 的结构化信息,并利用其在海量电商数据集上的 Fine-tuning 学习到的知识,对信息进行语义理解、知识推理和决策生成,做出符合消费者特性的推理和决策。DSLLM 使用 Amazon SageMaker 自动拉起推理 endpoint,提供有弹性的推理能力。

6c1a8e033ec433e7464f068429b4e439.png

  1. 基于 langchain 构建的 multi-agnet 系统会根据用户关注的商品图片,通过 Amazon Bedrock 访问 Claude 3 模型,生成视觉 insight,根据图片标识,存储在数据库中。

  2. 商品视觉 insight 会结合商品结构化信息,生成商品的一个特征,存储在 ElastiCache。

  3. 经过 Supervisor Agent 的调度,将商品特征和模拟的用户特性,发送给部署在 Amazon SageMaker 推理节点上的 DSLLM 大模型进行推理,并生成决策方案。

最后

通过智能体间的高效协同,Claude 3 提供的多模态视觉,以及被海量数据 Fine-tuning 的 Altrubook DSLLM,Altrubook AI 能像人一样处理复杂的信息和知识,高效地生成决策建议,重塑信息获取和智能决策的方式。相信通过在多智能体、大语言模型等前沿领域的不断深耕和创新,必将为我们带来更多令人惊叹的成果和应用。

您仍然可以继续领略 Amazon Bedrock 上包括 Mistral, llama2 等领先的基础模型的魅力,对于 Amazon Bedrock 上的 Claude 3 模型,如果您的业务有出海需求,可以由您的海外关联公司在海外访问亚马逊云科技海外区域提供的相关模型,感受先进技术带来的无限可能,感谢您的支持与理解!

点击阅读原文查看博客,获得更详细内容!

本篇作者

0efa3d72eff15a35abdcd9a5bb559184.jpeg

陈建钧

阿尔特科技大模型训练负责人,计算机视觉领域的先驱人物。钻研人工智能算法,追求工程化落地、领域模型的情境理解与决策规划的创新性人工智能引擎。

6e10fa8da32703c7a1583dfee537b317.png

牛泽鹏

阿尔特科技大模型架构师,大模型算法研究人才。熟悉 Transformer 等大模型核心架构,极度追求算法创新,对于大模型推理加速、架构优化有着多年丰富经验。

709e120a97fb66b88e086ef78b319912.jpeg

曹镏

亚马逊云科技解决方案架构师,专注于为企业级客户提供信息化以及生成式 AI 的架构的咨询与设计,在 AI/ML 领域具有解决实际问题能力以及落地大型模型训练项目的经验。

f666ee1da8c183b197abc1ee05c4c4ee.gif

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

2c625daedda334b0f72c53c03b54a5b9.gif

听说,点完下面4个按钮

就不会碰到bug了!

c96db4ec165b03c17e01dce15af0cb82.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/585837.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32H5 读取温度传感器校准值时进 HardFault 的原因分析

1.前言 有客户反馈,在使用 STM32H5 读取温度传感器校准值地址时,会进入 HardFault,而在其他系列芯片中读取这个参数时并没有此现象。在 NUCLEO-H563ZI 开发板上去复现此问题,发现只有开启 ICACHE 后才会复现,初步验证…

ZCMU操作系统课程实验 - 实验1-Linux的使用

登录 1. 打开这个东西 2. 在 文件 - > 打开 中打卡机房里VMOS文件里的这个东东 3. 然后依次操作下去好了,有红色的选项,我都是选的"Do nothing"。完成后就会出现这样一个黑框框。 4. 让你登录。输入:root。密码&…

正则表达式浅析

正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很…

【技巧】如何解除Excel“打开密码”?

给Excel表格设置“打开密码”,可以保护表格不被他人随意打开,那如果后续不需要保护了,不想每次打开Excel都需要输密码,要怎么去除“打开密码”呢? 今天分享3个方法,最后一个方法记得收藏起来,以…

有哪些绝美的古诗词呀?

编辑搜图 请点击输入图片描述(最多18字) 绝美的古诗词是中国古代文化的重要组成部分,它们以优美的语言和深邃的意境,展现了古代人们的生活、情感和思想。以下是一些绝美的古诗词,它们不仅具有文学价值,更…

微功耗轨至轨运算放大器芯片D8541和D8542对比分析

D8541和D8542是芯谷科技推出的两款微功耗轨至轨运算放大器芯片,其中D8541为单运放,D8542为双运放,它特别适用于NTC温度采集电路、ADC基准电压电路、有源滤波器、电压跟随器、信号放大器等电路应用,在新能源充电桩、智能充电枪、储…

c# 插值搜索-迭代与递归(Interpolation Search)

给定一个由 n 个均匀分布值 arr[] 组成的排序数组,编写一个函数来搜索数组中的特定元素 x。 线性搜索需要 O(n) 时间找到元素,跳转搜索需要 O(? n) 时间,二分搜索需要 O(log n) 时间。 插值搜索是对实例二分搜索的改进,…

GaussDB云数据库极简版安装与使用-新手指南

一、前言 作为一款领先的企业级数据库管理系统,GaussDB 提供了强大的性能、高度可靠性和丰富的功能,是企业构建可靠、高性能的数据库解决方案的理想选择。 本文主要针对高校和个人测试环境,介绍极简版安装和使用过程,更加适合高…

深入云原生:解析 Docker 容器、Serverless 计算和微服务架构的实战应用

文章目录 一、前言二、行业顶尖技术实践精华集概览三、腾讯云容器和函数计算技术实践案例3.1 精选集中的 Stable Diffusion 腾讯云云原生容器部署实践3.2 精选集中的数数科技大数据查询引擎云原生实践3.2.1 大数据查询引擎技术痛点3.2.2 基于腾讯云云原生解决方案(一…

Netty学习——源码篇10 Netty内存分配ByteBuf基础

1 初始ByteBuf ByteBuf是Netty整个结构中最为底层的模块,主要负责把数据从底层I/O读取到ByteBuf,然后传递给应用程序,应用程序处理完成后再把数据封装成ByteBuf写回I/O。所以,ByteBuf是直接与底层打交道的一层抽象。 2 ByteBuf的…

非关系型数据库之Redis配置与优化

一、关系数据库与非关系型数据库 1.1关系型数据库 关系型数据库是一个结构化的数据库,创建在关系模型(二维表格模型)基础上一般面向于记录。SQL语句(标准数据查询语言)就是一种基于关系型数据库的语言,用…

【漏洞复现】某科技X2Modbus网关多个漏洞

漏洞描述 最近某科技X2Modbus网关出了一个GetUser的信息泄露的漏洞,但是经过审计发现该系统80%以上的接口均是未授权的,没有添加相应的鉴权机制,以下列举多个未授权接口以及获取相关敏感信息的接口。 免责声明 技术文章仅供参考,任何个人和组织使用网络应当遵守宪法法律…