为何焦点已从 AI 代理转向AI辅助人类工作模式

news/2025/2/11 10:21:46/文章来源:https://www.cnblogs.com/jellyai/p/18709256

前言:随着AI技术的发展,AI行业从AI代理转向了‘AI辅助人类工作模式’。虽然AI代理在演示中很有潜力,但在实际使用时,它的准确性和可靠性远低于人类,限制了它的应用。相反,‘AI辅助人类工作模式’通过将复杂任务拆分成小步骤,帮助人类更高效地完成工作,推动了数据整理和推理能力的提升。这一转变反映了企业越来越注重如何通过利用AI来实际解决问题,应对快速变化的技术和不断增长的业务挑战。

我们正处于一个阶梯之上,从大型语言模型的引入,到具备类人数字交互的 AI 代理的出现。但……

……在商业应用方面出现了转变,焦点已从 AI 代理转向了代理式工作流/数据综合。 为什么焦点(暂时)远离了 AI 代理?

像 Salesforce 和 Service 这样的公司曾大力转向 AI 代理,但 AI 代理的严峻现实是,技术在准确性方面尚未达到应有的水平。

如果撇开营销炒作以及 AI 代理的优秀原型和演示来看,它们的准确性尚不足以用于生产环境。

Claude AI 代理计算机接口(ACI) 的性能仅为人类表现的 14%。

下方的图表来自 TheAgentFactory,展示了 AI 代理在成本、步骤和成功率方面的位置。请注意,成功率大约为 20%。

这些数据是当前情况的真实写照。

随着最近 OpenAI Operator 的发布,计算机使用和 Web 浏览的准确率达到了 30% 至 50%,但仍然低于人类 70% 以上的能力。

此外,还有有趣的研究表明,具备 Web 浏览能力的 AI 代理容易受到恶意弹出窗口的攻击。

AI 代理想要像人类一样执行任务有两条路径:一是通过 Web 浏览器(如 Webvoyager、OpenAI Operator 等);二是通过操作系统的完整 GUI(如 Anthropic)。

这些方法将 GUI 作为 AI 代理的 API 进行使用。

最初的方法是使用单独的 API,但由于开发每个 API 集成的开销过大,这种方式并不现实。而且,许多商业应用根本没有 API 可用。

为何聚焦代理式工作流 所有人都同意现代知识型工作已经崩坏,各种报告给出了不同的数据。其中一份报告指出,员工有 30% 的时间花在搜索信息上。

知识型工作者在回答复杂问题时面临挑战,他们需要从不同的文档中综合信息。

代理式工作流(如下图所示)能够进行推理,并将复杂任务分解为更简单的子任务,再将这些任务以链式结构串联执行。

通过执行这些任务序列,可以引入可观测性、可检查性和可发现性等元素。

数据的综合将变得越来越重要。代理式工作流就是一个例子,它能够为知识型工作者综合工作数据和资源,提供一个统一的答案。

语言模型提供商正在摆脱仅提供模型的局限,而是向用户体验扩展。ChatGPT 的深度研究(Deep Research)并不是一个新模型,而是在 ChatGPT 内部新增的代理式能力,能够在互联网上进行多步研究,以解决复杂任务。它在几十分钟内完成的任务,通常需要人类花费数小时。

这也是一个很好的例子,展示了如何综合不同来源的数据来回答用户的问题。

我觉得这是 LlamaIndex 提出的“代理式 RAG”理念,即在某个特定时间点,为“唯一的受众”综合数据将变得至关重要。

在未来几个月,个人代理式工作流、信息综合,以及所谓的桌面编排(desktop orchestration)将成为重点关注方向。

推理与问题解决

现代 AI 模型正日益将推理作为核心功能,使其能够通过将复杂问题拆解为可管理的部分来解决问题。

这一转变基于一种创新方法,即将问题分解为更小的子集,使模型能够系统地处理每个部分。

通过将推理视为内部机制,这些模型能够模拟人类的思维过程,增强其提供准确、细致响应的能力。

这种分解策略不仅提高了问题解决的效率,还增强了对推理过程的透明度。

结果是,用户可以获得更具可解释性的输出,缩小了高级计算与可理解决策之间的差距。

最初,用户需要在提示词中加入推理特性,指导模型如何进行推理,并拆解复杂或复合任务。同时,通过少样本示例(few-shot approach)来引导模型模仿。

**总结 **

组织必须将关注点从固定在某些特定工具或趋势上转移——例如,曾自称为 RAG 公司、提示工程(Prompt Engineering)游乐场等,而应优先解决现实世界的商业挑战。

世界正以前所未有的速度向前发展,几乎每天都有新技术涌现,每种技术都宣称能够颠覆行业。

但真正衡量创新的标准,不是掌握最新技术,而是如何应用这些进步来创造实际价值。

无论是改善客户体验、优化运营,还是解决社会需求,核心问题始终是:我们如何利用技术提供有意义的解决方案?

通过这种思维方式,企业能够让自己具备面向未来的能力,并确保在不断变化的浪潮中保持竞争力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/881995.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CentOS7 离线安装docker环境

1、系统要求 首先需要确定 CentOS7 的内核版本号,因为 docker 安装要求 Linux 内核版本在 3.10 及以上。查看内核版本号: uname -r查看系统名称: cat /etc/redhat-release2、下载Docker Docker官网:Docker: Accelerated Container Application Development Docker引擎安装说…

烟草行业如何用低代码+ BI 实现数字化转型?

在数字经济的大潮中,烟草行业正迎来重大的发展契机。国家层面的政策引导和战略规划为行业的数字化转型提供了明确的方向。《数字中国》的愿景逐步变为现实,国家信息化发展战略的深入推进,为烟草行业的智能化、网络化发展提供了强劲的动力。基于全国烟草工作会议重点的指导方…

鸿蒙开发 - 支持导出,跨文件使用的自定义样式 AttributeModifier

我们在自定义组件的时候,无论是用 @Styles 还是 @Extend,都很难真正做到独立的封装样式,因为这两者都不支持导出,不可以跨文件调用 这篇文章主要介绍一个接口 AttributeModifier,它很好的解决了这些弊端,可以实现样式的集中管理和复用,支持跨文件调用封装好的样式类 Att…

滑坡监测识别摄像机

滑坡监测摄像机能够24小时不间断地拍摄特定区域,并将实时画面传输到控制中心。这一功能确保了对潜在滑坡区域的持续关注,可以第一时间发现异常情况。通过集成深度学习算法,这些摄像机可以自动分析捕捉到的视频数据。例如,当检测到土壤位移或岩石崩落时,系统会立即发出警报…

『玩转Streamlit』--会话状态管理

在Web应用开发中,会话管理是一个至关重要的概念,它能够帮助开发者追踪用户在应用中的行为和状态,从而为用户提供更加个性化、连贯且高效的交互体验。 Streamlit作为一个简单而强大的用于快速构建和部署数据科学和机器学习项目,也提供了强大的会话状态管理功能,即st.sessio…

深度学习四大名著-蜥蜴书-《机器学习实战:基于Scikit-Learn、Keras和TensorFlow 原书第3版 中文版+英文版》PDF、EPUB免费下载

深度学习四大名著全新升级版,为机器学习落地实践提供翔实指导,Keras之父鼎力推荐。 这本机器学习畅销书基于TensorFlow 2和Scikit-Learn的新版本进行了全面更新,通过具体的示例、非常少的理论和可用于生产环境的Python框架,从零帮助你直观地理解并掌握构建智能系统所需要的…

看板软件在酒店行业:从任务分配到跨部门协作的全面升级

酒店行业通过使用看板软件进行项目管理,可以实现任务的可视化管理、提高跨部门协作效率、优化工作流程以及持续监控与优化项目进展。这有助于酒店提升运营效率、服务质量以及客户满意度。酒店行业使用看板软件进行项目管理,可以有效提升运营效率和服务质量。以下是如何在酒店…

DevOps和它的朋友们——聊聊其他 “Ops”(一)

DevOps不仅仅是将敏捷开发概念与IT运维相结合,还简化了在云环境中开发和部署应用程序的过程,从而使开发生命周期大大缩短。大家好,我是陈哥,今天想和大家聊聊DevOps与其他“Ops”。 DevOps不仅仅是将敏捷开发概念与IT运维相结合,还简化了在云环境中开发和部署应用程序的过…

进程权限 - 降低子进程权限(windows)

在 Windows 系统中,管理员权限和非管理员权限运行的程序之间不能使用 Windows 提供的通信机制进行通信。对于部分文件夹(ProgramData),管理员权限创建的文件是不能以非管理员权限修改和删除的。 然而,一个进程运行之后启动的子进程,会继承当前进程的 UAC 权限;于是有时我…

java安全中的类加载

java安全中的类加载本文所涉及的内容仅供参考与教育目的,旨在普及网络安全相关知识。其内容不代表任何机构、组织或个人的权威建议,亦不构成具体的操作指南或法律依据。作者及发布平台对因使用本文信息直接或间接引发的任何风险、损失或法律纠纷不承担责任。对应的代码我发在…

cvat nuclio serverless pip install安装失败

cvat nuclio serverless 安装自动标注插件失败./serverless/deploy_cpu.sh serverless/onnx/WongKinYiu/yolov7主要pip安装失败的原因是部分依赖包不能够在大陆下载 只需要将function.yaml内的脚本添加依赖加速即可-i https://pypi.tuna.tsinghua.edu.cn/simple

Qt写Word文档-Windows

电脑没有安装微软的office,安装的是wps,用的是 QAxObject,所以只支持Windows系统一、pro文件添加 axcontainer 二、实现代码#include <QAxObject> #include <QDebug> // 创建Word应用程序对象 QAxObject* word = new QAxObject("kwps.Application");…