免费的GPT4终于要来了!OpenAI直播发布会详细解读!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

上周我在“重磅!5月13日下周一,OpenAI直播发布新功能!”一文中预告了OpenAI的这场被OpenAI CEO称为“magic”的直播发布会,本周一,它如约而至。

OpenAI果然没有令人失望。首先,主持人Mira Murati(OpenAI CTO)官宣了ChatGPT的桌面客户端,以及全新的web UI界面。其次,重头戏来了,Mira介绍了一款全新的模型GPT-4o,并且宣布这款GPT-4模型会对所有用户开放,当然包括免费用户!

ChatGPT桌面版客户端

根据Mira介绍,ChatGPT桌面版客户端即将公测,会最先推出macOS版本,然后会在今年晚些时候推出Windows版本。还是延续了OpenAI一贯的灰度发布的作风,目前已经开始陆续向用户推出。

我也收到了OpenAI的灰度测试,收到测试后ChatGPT会有信息提醒如下。注意,macOS版本目前仅支持Apple芯片的Macbook,系统要求macOS 14及以上。

为什么要发布桌面端?其中一大亮点就是可以直接共享电脑屏幕给ChatGPT,更加方便和ChatGPT对话。在直播后半程的demo中,OpenAI的Research lead给我们展示了这一功能。

最新的模型GPT-4o

直播发布会大概有效时长25分钟,至少有20分钟都是在介绍或者演示GPT-4o这个最新的模型。目前该模型已开始灰度发布,已经有不少小伙伴收到了这个新模型的使用资格。我也正好在今天下午就收到了体验资格。

收到灰度测试邀请的小伙伴在重新进入ChatGPT页面后会收到下面这个弹窗提醒。

在左上角模型选择处,已经多出来了一个GPT-4o的选项。

那么,为什么是GPT-4o模型?它牛在哪里?

多模态能力

GPT-4o,全名为GPT-4 omni,omni在英文里是“全能”的意思。

GPT-4o是一个本质上的多模态模型,能够深度理解和生成不同格式的内容,包括文本、语音和图像。这使得它可以在各种交互中更加灵活,例如接受语音命令或处理视觉数据。

理解能力是AI能够和我们人类进行交互的基础。而多模态级别的理解能力将会使得AI和我们交互方式更进一步。在直播发布会的后半程,OpenAI的研究人员为观众在实时对话中演示了这一最新模型的多模态能力,GPT-4o快速且正确地识别出了白纸上写的数学方程以及文字。这种多模态级别的理解能力虽然靠OCR识别实现,但它对外给人的感觉已经不再像一个应用程序,而是一个有理解能力的“智能体”!

实时语音和视频对话

注意,GPT-4o具有实时语音对话的功能!

可能有小伙伴能够联想到,之前ChatGPT以及Kimi Chat也有对话功能,也就是“语音模式”,你可以以语音的形式问问题,然后对方会针对你的问题进行回复,当然也是以语音的形式。但这种形式归根结底只能算是“对话”,而远远不是“实时对话”!比如,对于AI的语音回答,你必须从头听到尾,然后你再问,它再答。

什么是“实时对话”,就像是你和朋友打电话那样,你可以随时打断对方,表达自己的观点,而对方也能够理解你的意思,对给予回应。这就是新模型GPT-4o具有的功能,可以简单理解为由世界上最强大的LLM模型驱动的Siri,Alexa,小度和小爱同学。

在demo中,OpenAI的研究人员能够随意打断GPT-4o的讲话,就像是真正的对话那样。并且,GPT-4o的回复是实时的,而不是像以前那样,需要思考几秒钟(其实是在生成答案),然后再用语音回答,导致对话的体验很不连贯。更重磅的,GPT-4o甚至能够理解说话者的情感,具有了情感感知的能力!GPT-4o能够听到并判断出demo者在喘粗气,它会给出"slow down"的建议,并且,GPT-4o能够根据要求任意改变语调、音色等等,可以把音色加上各种从弱到强的感情色彩!

更快的响应速度

GPT-4o的响应速度是GPT-4 Turbo的两倍,这有助于更快速地应答和更有效地处理数据。同时,这也是为什么这个模型能够做到如此逼真的“实时对话”。

增加可访问性

Mira宣布,GPT-4o会在未来的几周内对所有用户免费开放,而付费用户的使用数量限制是免费用户的五倍。

支持API使用

对于开发者来说,该模型的API rate limit显著提高,是GPT-4 Turbo的五倍,允许在各种应用中更广泛地使用该模型,从简单的脚本到复杂的集成系统。

目前,GPT-4o模型的API已是可用状态,定价为GPT-4 Turbo的一半:

  • 输入:5 USD/1M Tokens

  • 输出:15 USD/1M Tokens


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/697778.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sql注入中的替换技巧。

目录 1:注释的替换 2:空格替换 3:大小写混合绕过及双写绕过 4:等号的绕过 5:单双引号的绕过 1:注释的替换 注释在sql注入中非常重要,因为会使用它来闭合我们注入的sql语句。 当以get方式提…

通过钉钉卡片进行工单审批

我们通常通过钉钉机器人来发送通知,提醒审批人名下有待办工单需要处理。这种通知方式仅能提醒审批人到ITSM中处理,审批人需要打开电脑登陆平台处理,我们就考虑是否能有一种方式能够满足移动端审批? 这里我们可以使用ITSM的移动端版…

使用Pyramid、Mako和PyJade生成 HTML

Pyramid 是一个流行的 Python Web 框架,而 Mako 和 PyJade 是用于模板引擎的工具,它们可以与 Pyramid 配合使用来生成 HTML 内容。但是在实际使用中还是有些差别的,尤其会遇到各种各样的问题,下面我将利用我所学的知识一一为大家解…

Django模型进阶

接上一节 4.查询数据 在Django中,正向查询(Forward Query)和反向查询(Reverse Query)是ORM(Object-Relational Mapping,对象关系映射)中用于处理数据库表间关系时的两种查询方式&a…

江门水文分局开展防灾减灾主题宣传活动

5月11日,第16个全国防灾减灾日到来之际,广东省水文局江门水文分局联合江门市五邑义工联合会直属义工服务总队(亲子服务队)在江门市万达广场举办了一场别开生面的防灾减灾主题宣传活动,进一步培育孩子们的防灾减灾的意识…

FPGA verilog LVDS通信协议笔记

一幅图胜过千言万语 直接开始挫代码,先写top.v。 module top();reg clk; // 生成时钟的寄存器 reg rst; // 生成复位信号的寄存器initial clk 1; // 初始值取1 always #1 clk ~clk; //1ns取反一次initial begin // 复位信号,先0,过段时间赋…

4.2 文本相似度(三)

换个思路,再训练一次。 1 基本框架 试想,如果有一个语句需要从预料库中匹配,每一次匹配都会伴随着大量的耗时: 一次匹配20ms, 1 000 000次呢,1 000 000 *20/ 1000 20 000S ~5.56H。效率极其的低&#x…

【PB案例学习笔记】-01创建应用、窗口与控件

写在前面 这是PB案例学习笔记系列文章的第一篇,也是最基础的一篇。后续文章中【创建程序基本框架】部分操作都跟这篇文章一样, 将不再重复。该系列文章是针对具有一定PB基础的读者,通过一个个由浅入深的编程实战案例学习,提高编…

今天开发了一款软件,我竟然只用敲了一个字母(文末揭晓)

软件课题:Python实现打印100内数学试题软件及开发过程 一、需求管理: 1.实现语言:Python 2.打印纸张:A4 3.铺满整张纸 4.打包成exe 先看效果: 1. 2.电脑打印预览 3.打印到A4纸效果(晚上拍的&#x…

JavaEE初阶-多线程5

文章目录 一、线程池1.1 线程池相关概念1.2 线程池标准类1.3 线程池工厂类1.4 实现自己的线程池 二、定时器2.1 java标准库中的定时器使用2.2 实现一个自己的定时器2.2.1 定义任务类2.2.2 定义定时器 一、线程池 1.1 线程池相关概念 池这个概念在计算机中比较常见&#xff0c…

AI网络爬虫:用kimichat自动批量提取网页内容

首先,在网页中按下F12键,查看定位网页元素: 然后在kimi中输入提示词: 你是一个Python编程专家,要完成一个爬取网页内容的Python脚本,具体步骤如下: 在F盘新建一个Excel文件:提示词…

MySQL基础使用指南

难度就是价值所在。大家好,今天给大家分享一下关于MySQL的基础使用,MySQL 是一个流行的关系型数据库管理系统,被广泛应用于各种类型的应用程序开发中。本文中将介绍 MySQL 的基础使用方法,包括创建数据库、创建表格以及进行增删改…