Sam Altman再出手,投资了两个不到20岁的RPA创业者

在这里插入图片描述

“AI到底是变革还是泡沫?”

作者 | 王王
首图来源:IndiaTimes
Sam Altman又出手了。这次他投资了一个只有5个人的RPA早期团队Induced AI,两位联合创始人Aryan Sharma和Ayush Pathak,一个18岁,一个19岁。

不只是Sam Altman,SignalFire、Peak XV 、SV Angel等机构共同参与了Induced AI这一轮230万美金的种子轮融资。此次融资,科技加速器AI Grant的两位创始人Nat Friedman和Daniel Gross也加入了Induced AI的团队。这两位在科技界的大名如雷贯耳,Nat曾任Github的CEO,Daniel创立的搜索引擎公司Cue则被苹果收购。

这支团队及其产品有何过人之处,为何能够吸引众多大佬的橄榄枝呢?

01 RPA 3.0:打开浏览器,让AI完成所有工作

Induced AI的两位创始人——Aryan和Ayush——别看年龄小,创业经历却相当丰富。这两位年轻程序员的创业履历遍及医疗、广告、教育、区块链、web3等领域,甚至还发起过创业社群和类似孵化器的组织。

此次创立的Induced AI则是一款释放企业员工生产力的“RPA 3.0”。用户只需用简单的英语输入工作流程和录屏视频,Induced AI就能将其实时转换为伪代码,并调取多种相关工具,来执行大量重复性任务。

在这里插入图片描述

两位创始人|图源:Linkedln
RPA(Robotic Process Automation,机器人流程自动化)并非新鲜概念,普通人在日常生活中也随处可见,例如Excel中的“宏”,或者很多人用来抢演唱会门票的小工具“按键精灵”,都可以看做RPA的前身。传统的RPA定义上,软件记录人的操作,比如点击鼠标、键盘输入、打开文件夹、发送邮件等,并将这些操作固定下来形成规则和套路,批量地自动执行,从而节省人的时间,提升工作效率。随着AI技术进步,机器识别图像、理解语言、逻辑思考的能力不断提升,这些技术也与RPA结合到一起,释放更大的能量。

正如RPA概念所定义的,迄今为止,市面上的RPA工具需要人工制定好明确的规则,而复杂任务的规则也会耗费大量人力。Induced AI则借助大语言模型的能力,让工具有了逻辑推理和判断的能力。用户只需要说出他的需求,比如“给我建个Jira的ticket”,或者“帮我筛选一波简历,给候选人发面试邀请”,Induced AI就可以对要做哪些事情进行实时判断和拆解,并自动调取相关的工具来完成整个流程。

以筛选简历这个任务为例,常规的人工操作流程包括:登录你的领英账号、搜索简历、评估简历、下载简历、发送邀请等。如果领英没有提供官方的API接口,过去的RPA很可能就卡在登录这一步了,甚至可能被判定为恶意机器人。Induced AI在Chromium上构建了一个浏览器环境,它有自己的内存、文件系统和身份验证凭据(电子邮件、电话号码)来执行复杂的流程,因此可以自动完成登录、填写验证码、文件下载、存储和重复使用数据等动作,没有开放API的软件也拦不住Induced AI。

02 一波AI Agent正在袭来

让工具,特别是有智能的工具替人类干活,是从我们的老祖宗开始就产生的梦想。从木牛流马到Siri,人们始终觉得这些“助手”还欠点儿火候。直到ChatGPT和AutoGPT横空出世,AI Agent似乎即将成为可能。

OpenAI的研究员Lilian Weng撰文定义了基于大语言模型的AI Agent:大语言模型、记忆、任务规划、使用工具,四个模块缺一不可。尽管Induced AI团队将自己定位成“RPA 3.0”,但从其产品特性上来看,他们更像一个AI Agent,这也是为什么Sam Altman等AI大佬一致看好这个年轻的团队。

当前的AI热潮下,Induced AI不是第一个、也绝不是最后一个AI Agent团队。

暂且不提那些订票、点外卖的小而美Agent,或者AutoGPT、HuggingGPT等几乎人尽皆知的项目,与Induced AI有同样打造AI员工野心的团队就有不少。
例如今年三月完成3.5亿美元B轮融资的Adept,自己训练了一个ACT-1,这个模型专门用来在计算机上响应用户的自然语言指令并执行操作。它可以使用现有的所有软件工具、API和网站。ACT-1同样基于浏览器工作,用户可以在和AI的聊天框里输入自己的命令,例如在Salesforce里创建一条销售线索,或者在GoogleSheet里计算一些数据。

在这里插入图片描述

Adept的ACT-1|图源:Brigade Web

无独有偶,科技公司Rabbit也研发了自己的大模型LAM(Large Action Model),并基于它推出了一套完整的“个人操作系统Rabbit OS”解决方案。LAM能够观察人机交互的界面,形成“概念蓝图”,从而在用户的自然语言指令不那么明确的时候理解并实现人类的潜在意图。基于LAM,Rabbit还专门设计了一套软件平台,使其Agent能够更人性化地完成任务。今年10月,Rabbit获得Khosla Ventures领投、老股东跟投的2000万美元融资。

03 未来已来吗?

当然,除了创业团队,传统的RPA、低代码、无代码等公司,几乎无一不在拥抱大语言模型和AI Agent,毕竟在今天,只要一提这两个概念就能让投资人和客户眼前一亮,忍不住多看一眼。

今年以来,AI Agent的几个爆款应用和几次出圈,让人工智能的呼声一次次被推向高潮。可我们仍然不禁要问,未来已来吗?眼前的热闹是变革还是泡沫?

如果拿自动驾驶来做个比喻,我们更为熟悉的Copilot和Midjourney这样的产品类似L3级别的自动驾驶,即机器是人类的“助手”和“副驾”,而Agent对应着L4级别的自动驾驶,人类只需设定目标、监督结果,机器自己完成决策和执行。今天,L3级别的AI副驾仍然处于落地应用的早期,无论是技术能力还是商业价值,尚有大量值得探讨的问题,未能全面推广。

以此看来,L4级别的AI Agent大规模应用可能就更遥远了。那么,当前的AI热又是一波割韭菜的炒作吗?它是否会想几年前的区块链、VR、元宇宙一样,只是昙花一现?

在这里插入图片描述

Adept的ACT-1|图源:DEV
可以肯定的是,生成式AI以及相关的概念热度正在消退。

无论是媒体关注还是市场反应都已经暗暗证实了这一点。Gartner今年发布的技术成熟度曲线上,生成式AI和AI增强的软件工程都放在了膨胀期,意味着这两项技术在未来2-5年都即将进入幻灭期低谷——一如曾经的自动驾驶和上述技术概念。不过,正是在热度衰减、噪声安静的幻灭期,才有更多有意义的经验和知识沉淀下来,为接下来的启蒙期奠定基础。

在变革性技术的发展历程中,每一次波峰波谷都有意义。

从图灵机到IBM的超级计算机深蓝,从机器学习到神经网络,从AlphaGo到ChatGPT,每一个里程碑之间都充满失望、怀疑和寒冬,将视线拉长,人类走到今天已经取得了长足的进步。无论是否有泡沫,未来永远是乐观者和实干者创造的。

参考资料:
Sam Altman backs teens’ AI startup automating browser-native workflows(TechCrunch)
https://www.rabbit.tech/

https://www.adept.ai/

  • END -

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/162308.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[架构之路-254/创业之路-85]:目标系统 - 横向管理 - 源头:信息系统战略规划的常用方法论,为软件工程的实施指明方向!!!

目录 总论: 一、数据处理阶段的方法论 1.1 企业信息系统规划法BSP 1.1.1 概述 1.1.2 原则 1.2 关键成功因素法CSF 1.2.1 概述 1.2.2 常见的企业成功的关键因素 1.3 战略集合转化法SST:把战略目标转化成信息的集合 二、管理信息系统阶段的方法论…

Redis高级数据类型-HyperLogLogBitmap以及使用两种数据类型完成网站数据统计

网站数据统计 定义相关的Redis Key /*** 单日UV*/public static String getUVKey(String date) {return PREFIX_UVSPLITdate;}/*** 记录区间UV* param startData 开始日期* param endDate 结束日期* return*/public static String getUVkey(String startData,String endDate){r…

Git同时配置Gitee和GitHub

Git同时配置Gitee和GitHub 一、删除原先ssh密钥二、生成密钥 这里的同时配置是针对于之前配置过单个gitee或者github而言的,如果需要看git从安装开始的配置,则可以看这一篇文章 git安装配置教程 一、删除原先ssh密钥 在C盘下用户/用户名/.ssh文件下找到…

KaiOS APN配置文件apn.json调试验证方法(无需项目全编)

1、KaiOS 的应用就类似web应用,结合文件夹路径webapp字面意思理解。 2、KaiOS APN配置文件源代码在apn.json, (1)apn.json可以自定义路径,通过配置脚本实现拷贝APN在编译时动态选择路径在机器中生效。 (…

MyBatis 分页插件 PageHelper 6.0.0 发布

6.0.0 - 2023-11-05 基于jdk8适配,6.0开始不支持jdk6和7,如果有需要可以使用5.x版本增加异步count支持,全局配置asyncCount,默认false,单次设置:PageHelper.startPage(1, 10).enableAsyncCount(); 异步使用…

Crypto(8) BUUCTF-bbbbbbrsa1

题目描述: from base64 import b64encode as b32encode from gmpy2 import invert,gcd,iroot from Crypto.Util.number import * from binascii import a2b_hex,b2a_hex import randomflag "******************************"nbit 128p getPrime(nbit)…

HarmonyOS ArkTS基础知识

概述 上一节,学习了TypeScript的基础语法,而在鸿蒙开发当中,有基于自己的编程语言,便是ArkTS。它是一种声明式UI的编程范式的语言,开发框架如下图所示: 根据框架图,分析,我将它大致…

吸引人的标题公式-爆款标题

有的朋友图文或视频质量明明很不错 但数据有时候却不尽人意 这个时候就可以考虑一下是不是标题的原因 这篇总结出万能公式以供参考

unity【动画】脚本_角色动画控制器 c#

首先创建一个代码文件夹Scripts 从人物角色Player的基类开始 创建IPlayer类 首先我们考虑到如果不挂载MonoBehaviour需要将角色设置成预制体实例化到场景上十分麻烦, 所以我们采用继承MonoBehaviour类的角色基类方法写代码 也就是说这个脚本直接绑定在角色物体…

第21期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练 Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以…

LangChain+LLM实战---Midjourney高级技巧的极简教程

原文:An advanced guide to writing prompts for Midjourney ( text-to-image) 作者:Lars Nielsen Midjourney生成的图像,文本Prompt:beautiful, fantasy city unreal engine 一句话介绍midjourney ? 对于那些还没有听说过Mid…

【算法练习Day40】打家劫舍打家劫舍 II打家劫舍 III

​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:练题 🎯长路漫漫浩浩,万事皆有期待 文章目录 打家劫舍打家劫舍 II打家劫…