OpenAI发布新品GPT-4o,电影《HER》演绎的世界真的来了!

5月14日,OpenAI宣布推出最新旗舰生成式AI模型GPT-4o,它可以实时处理音频、视觉、并对文本进行推理。可以说这是一种全新的交互模式,它完美复刻电影《Her》的世界,标志着人工智能全感知时代的到来。

GpuMall智算云 | 省钱、好用、弹性。租GPU就上GpuMall,面向AI开发者的GPU云平台

发布会结束后,OpenAI首席执行官Sam Altman在社交媒体上发表了一个单词“Her”,寓意着GPT-4o有望让科幻电影中演绎的剧情走入现实。#autodl#恒源云#矩池云#算力云#恒源云 实例迁移#autodl 官网#autodi#GpuMall#GPU云#AutoDL#AotuDL 算力云#GpuMall智算云#AI#大数据#算力租赁#大模型#深度学习#人工智能#算力变现

GPT-4o的“o”代表“omni”,意为全能,是迈向更自然人机交互的一步。与现有模型相比,GPT-4o它在视觉和音频理解方面尤其出色,它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。

在接入GPT-4o后,ChatGPT可接受输入任意文本、音频和图像的组合,并可输出生成文本、音频和图像的任意组合。借助GPT-4oOpenAI跨文本、视觉和音频,端到端地训练了一个新模型,将所有输入和输出都在该模型中交由同一神经网络进行处理。而在API方面,GPT-4o的价格是GPT-4-turbo的一半,速度是GPT-4-turbo的两倍,限制速率高5倍。

发布会上,OpenAI前沿研究部门主管Mark Chen展示了ChatGPT在接入GPT-4o后的实时语音交互能力,如何识别用户语音中的情绪,以及如何用不同的声音朗读AI生成的故事,包括超级戏剧化的朗诵、机器人音调,甚至唱歌。

除了语音情绪识别功能,GPT-4o还具有实时视觉功能,ChatGPT可以变身真实的老师,通过手机摄像头帮助你实时解题。甚至它还能通过前置摄像头观察用户的表情,分析情绪。

GPT-4o还可帮助充当盲人的“第三只眼”,通过GPT-4o模型实时视觉与语音能力,决策辅助能力等,使得盲人和视力受限用户能够通过语音助手的帮助,实时了解周围的环境,帮助用户做出决策,如识别物品、导航指引等。

与传统的AI相比,GPT-4o看起来像是一个朋友,可以更自然亲切的与用户进行交流,它所提供的“陪伴式情绪价值”将AI虚拟陪伴赛道推向了新的维度。于是,针对同一个问题我们也将GPT-4(左)和GPT-4o(右)进行了对比测试,明显看来GPT-4o提供更富有情绪化。

Sam Altmanblog上发文称:“新的语音和视频模式是我用过的最好的电脑界面。这感觉就像电影里的AI,这让我有些惊讶。达到人类反应时间和表达能力是一个很大的变化。”

大家最关心的是什么时候可以在线体验GPT-4o。现在,进入ChatGPT页面,ChatGPT PlusTeam用户可以抢先体验「最新、最先进的模型」GPT-4o。在未来几周内,GPT-4o将分阶段继承在ChatGPT 在内的OpenAI 各个产品中,并免费提供给所有用户使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/700400.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

爆款预警!2024年必火的五大软件应用,你准备好了吗?

2024年必火的五大软件应用可以从多个角度进行预测。首先,人工智能(AI)的应用将继续扩大其在软件开发和用户体验改善中的作用。AI技术被用于改善用户体验,如聊天机器人,创建数据驱动的战略和决策,预测趋势以…

解决使用Vue.js前端与Flask后端API交互时跨源资源共享问题

我在使用flask以及Vue做一个项目时遇到了Vue前端与Flask后端API交互的问题就是前端获取不到后端返回的数据,报错: 上网查说是跨域问题,于是找了一些解决办法,就是可以通过设置响应头的 Access-Control-Allow-Origin 字段来允许所有…

基于svpwm(羊角波)控制策略的二极管钳位型三电平逆变器双闭环simulink仿真

本人搭建了基于svpwm(羊角波)控制策略的二极管钳位型三电平逆变器双闭环simulink仿真模型,该模型按照三电平SVPWM理论生成羊角波,并搭建了双闭环控制系统。效果十分优异,配置参考文献,适合学习使用。 DC&a…

jar包安装成Windows服务

一、前言 很多年前写过一篇《使用java service wrapper把windows flume做成服务》的文章,也是把jar包安装成windows服务,今天介绍另外一种更简便的方案。 二、正片 这次使用的工具是 winsw,一个Windows服务包装器。下面看详细介绍 首先从g…

CPU利用率使用教程

本文主要参考: 一文让你学到 nmon最详尽的用法 Linux性能监控命令_nmon 安装与使用 如果你是在Ubuntu上安装nmon,使用: apt install nmon安装好后,直接运行 $:nmon #运行如果是后台抓数据: -f 参数: 生成文件,文件…

第十六篇:数据库性能优化:从基础到高级的全面指南

数据库性能优化:从基础到高级的全面指南 1. 引言 在数字化的浪潮中,数据库作为信息系统的核心组件,其性能的优劣直接关系到企业的运营效率和市场竞争力。数据库性能优化不仅是一项技术挑战,更是一项战略任务。它要求我们深入理解…

短视频拍摄+直播间搭建视觉艺术实战课:手把手场景演绎 从0-1短视频-8节课

抖音短视频和直播间你是否遇到这些问题? 短视频是用手机拍还是相机拍?画面怎么拍都没有质感 短视频产量低,拍的素材可用率低 看到别人用手机就能把短视频拍好自己却无从下手 明明已经打了好几盏灯了,但是画面还是比较暗 直播软件参数不会设置,电脑…

[第五空间 2021]WebFTP

目录扫描git泄露phpinfo.php 一开始想到是sql注入,但是不行。目录扫描,发现 .git 和 phpinfo.php 访问phpinfo.php,ctrlf 搜索 flag,找到 flag。

3×3矩阵转置C++

对一个固定的33矩阵进行转置 #include <iostream>void matrixT(int src[3][3],int dest[3][3]) {for (int i0;i<3;i){for (int j0;j<3;j){dest[j][i]src[i][j];}} }int main(){int raw_matrix[3][3]{{1,2,3},{4,5,6},{7,8,9}};int Tmatrix[3][3]{0};std::cout<…

企业内部文化社区究竟有哪些好处?

首先&#xff0c;我们来了解下&#xff0c;企业内耗是什么? 在企业文化管理中&#xff0c;内耗是一个常见的问题&#xff0c;它会影响企业的团队协作、执行效率和绩效表现。在2023《哈佛商业评论》中国年会上&#xff0c;北大汇丰商学院管理实践教授陈玮分享了他对组织管理的…

Chatgpt教你使用Python开发iPhone风格计算器

上次使用Chatgpt写爬虫&#xff0c;虽然写出来的代码很多需要修改后才能运行&#xff0c;但Chatgpt提供的思路和框架都是没问题。 这次让Chatgpt写一写GUI程序&#xff0c;也就是你常看到的桌面图形程序。 由于第一次测试&#xff0c;就来个简单点的&#xff0c;用Python写用…

FreeRTOS【4】线程挂起和恢复

1.开发背景 基于上一篇指引&#xff0c;成功创建并启动线程后&#xff0c;线程已经开始运行了&#xff0c;但是有时我们需要线程暂停运行&#xff0c;例如某个线程是控制 LED 闪灯的&#xff0c;如果现在需要让 LED 停止工作&#xff0c;单纯的关闭 LED 是没用的&#xff0c;因…