重磅!OpenAI发布GPT-4o,非常惊艳语音版ChatGPT!

5月15日凌晨,谷歌召开“ I/O 2024”,生成式AI成为本次大会的重点并发布了一系列产品和多款大模型。

其中,谷歌DeepMind发布了一款全新的AI 代理(Agent)产品Project Astra,可以像昨天OpenAI发布的GPT4o一样,实现跨文本、音频、视频多模态实时推理。

例如,通过手机或谷歌眼镜让Astra解答数学题,解读周围环境等,这对于盲人、翻译、学习、导游、日常办公等领域帮助非常大。

图片

Project Astra功能展示

和GPT4o一样,Astra的多模态理解能力使其玩法非常多,这里「AIGC开放社区」就选一些有代表性的案例为大家展示。

例如,通过手机的摄像头让Astra对所有听到、看到的东西进行解读。可以点击扬声器、画笔、代码让其解释用途和含义。

此外,Astra还可以与谷歌眼镜一起配合使用,这也就是说盲人戴上它在走路、看东西时获得实时解读功能。

不过Astra的语音情感输出能力和数据响应效率,似乎比GPT4o差了一些。

也可以让Astra对一些草图、物品进行深度解读和联想。

Astra对提升搜索体验帮助也非常大,例如,通过视频让Astra解释,为什么留声机的指针没有放在转盘上,Astra会直接跳转搜索页面给出详细的解决方案。

甚至当你接到诈骗电话时,Astra都可以及时提醒你。所以,Astra更像是一位万能小管家可以做很多事情。

AI代理可以为我们做什么

其实,AI代理并非现阶段才出现的,深度游戏玩家应该知道20多年前一款外挂神器——按键精灵。

这便是最早的AI代理雏形,它可以通过用户输入的指令来执行特定操作,例如,让游戏人物只在特定场景打怪。不过使用方法比较繁琐,需要一些编程基础。

随后按键精灵演变成RPA(机器人流程自动化)从游戏场景扩展至办公领域,并在OCR、NLP、ML等多种AI加持下实现自动化完成,在金融、日常办公、数据搬运等应用非常广泛。

图片

而Astra、Project Astra在大模型加持下的AI代理属于第三代,在使用方式、能力方面获得巨大提升,为我们做的事情也更多。

健康管理与医疗咨询:AI健康代理助手可以通过分析用户输入的症状、健康记录和生活习惯,提供个性化的健康建议和早期疾病预警。

例如,一位患有糖尿病的人可以使用AI健康助手跟踪血糖水平,获得饮食和运动建议,甚至在血糖水平异常时获得提醒和建议寻求医疗帮助。

图片

客户服务自动化:AI代理可以集成在客服系统中,提供7*24小时无间断服务。能够理解和回应用户查询,提供账户信息、解决常见问题、处理交易等。

个性化学习辅导:AI学习代理可以根据学生的学习进度、兴趣和难点定制个性化学习计划。

通过分析学生的互动,识别其强项和弱点,然后调整教学内容和难度,以适应学生的学习速度,从而提高学习效率和成效。

目前,谷歌并没有公布Project Astra具体的发布时间,仍处于开发阶段。估计很快会登录到Android、iOS等平台中使用。

可以预见,由OpenAI、谷歌掀起的全能AI代理将成为生成式AI领域一个新的热门赛道。

同时为之前的智能RPA、AutoGPT等起到推波助澜的作用扩大认知和市场范围,极大培养了用户的习惯一个全民AI代理时代已经来临。

本文素材来源谷歌官网,如有侵权请联系删除

END

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/704071.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lambda 表达式详解

LAMBDA ⚪ λ 希腊字母表中排序第十一位的字母, 英语名称为Lambda ⚪ 避免匿名内部类定义过多 ⚪ 其实质属于函数式编程的概念 ⚪ 也可称为闭包 ⚪ Lambda允许把一个函数作为方法的参数(函数作为参数传递进方法中)。 Lambda是在jdk8之后出现的所以现…

无代码无国界:我们正在走向软件安全的狂野西部吗?

我们使用的几乎所有东西都是基于代码构建的,从汽车到智能冰箱再到门铃。在企业中,无数的应用程序保持设备、工作流程和操作的运行。因此,当早期的无代码开发平台于 2010 年推出时,承诺为公民开发人员提供更易于访问的应用程序开发…

【Amplify_自己写的shadr遇到没有阴影的解决方案】

Amplify 自己写的shadr遇到没有阴影的解决方案 2020-01-21 16:04 本来我有个百试很灵的投射阴影脚本。 这次不灵光了!地形内建材质,这个不支持投射的阴影~~奇了怪了。 可以采用引用的方式UsePass加入阴影部分代码,具体操作如下&#xff1…

惠普打印机无线网络连接设置

休息一下,灌个水。这次没多少内容,具体步骤惠普官网上都有,唯一增加的是对安装过程中踩的坑做了一个说明。 一.打印机无线网络连接设置步骤 惠普打印机设置无线网络连接,共16个步骤。 1. 在电脑上打开任意浏览器&am…

设计模式-动态代理

目录 定义 代理模式的优缺点 优点 缺点 应用场景 静态代理 动态代理 相关资料 定义 代理模式(Proxy Pattern)是一种结构型设计模式,它的概念很简单,它通过创建一个代理对象来控制对原始对象的访问。代理模式主要涉及两个…

【UE5.1 角色练习】01-使用小白人蓝图控制商城角色移动

目录 效果 步骤 一、导入资源 二、控制角色移动 三、更换角色移动动作 效果 步骤 一、导入资源 新建一个工程,然后在虚幻商城中将角色动画的相关资源加入工程,这里使用的是“动画初学者内容包”和“MCO Mocap Basics” 将我们要控制的角色添加进…

C# Winform+Halcon结合标准视觉工具

介绍 winform与halcon结合标准化工具实例 软件架构 软件架构说明 基于NET6 WINFORMHALCON 实现标准化视觉检测工具 集成相机通讯 集成PLC通讯 TCP等常见通讯 支持常见halcon算子 图形采集blob分析高精度匹配颜色提取找几何体二维码提取OCR识别等等 。。。 安装教程 …

PMR-440N7Q韩国施耐德三和相序继电器EOCR-PMR

韩国施耐德三和EOCR继电器PMR-440N7Q PMR-440-N 直流电动机保护器:DCL、DOCR-S/H 欠电流继电器:EUCR-3C 交流电压继电器:EOVR、EVR-PD、EVR-FD、EUVR 韩国三和EOCR电动机保护器:EOCR-SS、EOCR-SS1/SS2、EOCR-AR、EOCR-ST、EOCR-SP、EOCR-SP1/SP2、EOCR-SE、EOCR-SE2/SE PMR-44…

刘邦的创业团队是沛县人,朱元璋的则是凤阳;要创业,一个县人才就够了

当人们回顾刘邦和朱元璋的创业经历时,总是会感慨他们起于微末,都创下了偌大王朝,成就无上荣誉。 尤其是我们查阅史书时,发现这二人的崛起班底都是各自的家乡人,例如刘邦的班底就是沛县人,朱元璋的班底是凤…

新手去做抖音小店,多久稳定出单?出单的前提需要做好哪些工作?

大家好,我是电商小V 很多小伙伴经常去咨询的一个问题,那就是我是新手去做抖音小店多久才能够稳定出单呢? 根据我多年做店的经验来说,新手运营抖店的时候,只要自己的做店思路正确,执行力到位,一…

Vue3实战笔记(22)—路由Vue-Router 实战指南(路由传参)

文章目录 前言一、路由router-link二、路由传参1.query方式2.params方式3.props传参 总结 前言 vue-router 是 Vue.js 官方路由管理器。它和 Vue.js 核心深度集成,让用 Vue.js 构建单页应用变得易如反掌。 前面提到过简单的使用路由,直到上文使用404界面…

电脑常用的PDF阅读器-嗨动PDF编辑器!带你详细了解它

电脑常用的PDF阅读器-嗨动PDF编辑器!在数字化信息爆炸的时代,PDF格式的文件因其易于打印和保留原始格式等优点,成为了人们日常工作和学习的常用格式。而对于PDF文件的处理,一款功能强大、操作简便的PDF阅读器是必不可少的。今天&a…