Google 发布史上最强大模型,能否抗衡 OpenAI?

昨晚 Google 发布了史上最强人工智能模型:Gemini。

图片

Google CEO Sundar Pichai CEO 说 Gemini 时代是 Google 新时代的开始

Gemini 是 Google 最新的大型语言模型,Pichai 首次在 6 月的 I/O 开发者大会上透露了这一消息,如今正式公开发布。根据 Pichai 和 Google DeepMind CEO Demis Hassabis 的描述,这是 AI 模型的一次巨大飞跃,最终将影响几乎所有的 Google 产品。Pichai 表示:“这一刻的强大之处在于你可以致力于一项基础技术的改进,它会立即在我们的所有产品中产生影响。”

Gemini 不仅仅是一个单一的 AI 模型。它有  Gemini Nano、Gemini Pro 和 Gemini Ultra 三个版本。Gemini Nano 主要是在 Android 上运行;Gemini Pro 用来驱动 Google 的 AI 服务,比如现在就可以在 Bard 上试用;而 Gemini Ultra 被称之为 Google 史上最强大的大语言模型(LLM),主要用于数据中心和企业级应用。

图片

Gemini 的三个不同量级的模型

谷歌以不同的方式推出不同的模型:Gemini Nano 支持的是 Pixel 8 Pro 用户;Gemini Pro 目前支持的是 Bard 用户;Gemini Ultra 将在明年推出。开发者和企业级客户将能够从 12 月 13 日开始通过 Google Cloud 上的 Google Generative AI Studio 或者 Vertex AI 来使用 Gemini Por 服务。目前 Gemini  只支持英语,但是很快会支持其他语言。Pichai 表示,这个模型最终将被整合到谷歌的搜索引擎、广告产品、Chrome 浏览器等全球范围内。它是谷歌的未来,而且它来得正是时候

一年多前,OpenAI 推出了 ChatGPT,该公司和其产品 ChatGPT 立即成为人工智能领域最火热的事物。现在,谷歌—这家为当前人工智能繁荣发展提供了许多基础技术的公司,近十年来一直自称为“人工智能为先”的组织,但是却被 ChatGPT 给了当头一棒,现在 Google 终于开始反击了。

谈及到和 OpenAI GPT-4 的对比,Hassabis说道“我们对这两个系统进行了非常彻底的比较和基准测试”。谷歌运行了32个成熟的基准测试,全面比较了这两个模型,从全面的多任务语言理解基准测试到比较两个模型生成 Python 代码的基准测试。“我认为在这32个基准测试中,我们在30个基准测试上都领先一大截”,Hassabis笑容满面地说,“其中一些非常狭窄,而另一些则更为广泛。”

在 32 项基准测试中,Gemini 在 30 项中超越了 GPT-4


在这些基准测试中(实际上它们大多数都非常接近),Gemini 的最明显优势来自其理解和与视频以及音频交互的能力。这在很大程度上是有意设计的:多模态一直是Gemini计划的一部分。谷歌并没有像 OpenAI 创建 DALL-E 和 Whisper 那样为图像和语音训练独立的模型;它从一开始就构建了一个多感官模型。“我们一直对非常通用的系统感兴趣,”Hassabis说。他尤其关注的是如何将这些模式混合起来—从任意数量的输入和感知中收集尽可能多的数据,然后以同样多样化的方式进行回应。

图片

图文基准测试结果

图片

多模态基准测试结果

目前,Gemini最基本的模型是文本输入和文本输出,但像Gemini  Ultra这样更强大的模型可以处理图像、视频和音频。“它将变得更加通用,”Hassabis说。“仍然有一些东西,比如动作和触摸——更像是机器人类型的事物。”随着时间的推移,他表示,Gemini将获得更多的感知,变得更加意识到周围环境,并在这个过程中变得更加准确和扎实。“这些模型在某种程度上更好地理解了周围的世界。”当然,这些模型仍然可能产生幻觉,而且它们仍然存在偏见和其他问题。但Hassabis表示,它们了解得越多,表现就会越好。

Gemini 能更好的理解周边环境


尽管基准测试只是基准测试,但最终,对于Gemini的能力来说,真正的测试将来自那些希望能够使用 Gemini 来产生创意、查找信息以及编写代码的日常用户。Google 认为编码是 Gemini 的一个杀手级使用场景,它使用了一种新的代码生成系统 AlphaCode 2,其性能优于 85% 的编码竞赛参与者,而且比 AlphaCode 有了 50% 的性能提升。

Google 将Gemini 的发布视为更大项目的开始,也视为 Google 自身的一次重大改变。Gemini是谷歌一直在等待的模型,是多年来一直在努力构建的模型,甚至可能是在OpenAI和ChatGPT主导世界之前就应该准备好的模型。

在 ChatGPT 推出后,Google 发布了“红色警报”,这之后谷歌似乎一直在试图紧随其后,而且一直在努力地迎头赶上。然而,谷歌似乎仍然试图坚守其“大胆而负责任”的口号。Hassabis和Pichai都表示,他们不愿意过快行动,尤其是在我们接近最终的人工智能梦想时:人工通用智能,这是指一种能够自我改进、比人类更聪明且准备改变世界的人工智能。Hassabis说:“随着我们接近AGI,事情将会有所不同。这是一种主动的技术,所以我认为我们必须谨慎对待。谨慎,但乐观。

谷歌表示已经努力确保Gemini的安全性和责任性,而且通过了内部和外部测试以及红队测试。Pichai指出,确保数据安全性和可靠性对于以企业为先的产品尤为重要,而这正是大多数生成式人工智能赚钱的地方。但Hassabis承认,推出一款尖端的人工智能系统的风险之一是它可能会出现无法预测的问题和攻击向量。“这就是为什么你必须发布这些东西,”他说,“以便观察和学习。”谷歌对Ultra版本的发布采取了特别慎重的步伐;Hassabis将其比作受控的测试版,为谷歌最强大且无拘束的模型提供了一个“更安全的实验区”。基本上,如果在Gemini里有一个破坏婚姻的另类人格,谷歌希望在用户发现之前找到它。

多年来,Pichai和其他谷歌高管一直在歌颂人工智能的潜力。Pichai本人不止一次表示,人工智能将对人类产生比火或电更为深远的变革。在这第一代中,Gemini模型可能不会改变世界。最乐观的情况是,它可能只是帮助谷歌在建设出色的生成式人工智能的竞赛中赶上OpenAI(最糟糕的情况是,Bard仍然平庸无奇,ChatGPT继续占据主导地位)。但是Pichai、Hassabis以及谷歌的所有其他人似乎都认为这只是一切真正巨变的开始。

互联网使谷歌成为科技巨头;Gemini可能会更加庞大。

AI 如何驱动 DevOps


随着 AIGC 的快速发展,AI 已经开始加速渗透各行各业,DevOps 就是一个典型的领域。作为一体化 DevOps 平台领域的领头羊— GitLab,已经在 AI 与 DevOps 的结合方面,落地了很多功能。比如使用 AI 来解释代码、解释漏洞、推荐代码审核人员等。目前已经成为业界领先的 AI 驱动的一体化 DevSecOps 平台

由于这些出色的创新能力,GitLab 第三季度的财报也是相当亮眼:第三季度同比增长 32%。

图片

作为 GitLab 在中国的发行版—极狐GitLab,目前正推出了 60 天专业版免费试用的政策。所有用户、企业都可以体验业界领先的一体化 DevSecOps 平台。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/256467.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用proteus实现串口助手和arduino Mega 2560的串口通信

本例用到的proteus版本为8.13,ardunio IDE版本为2.2.1,虚拟串口vspd版本为7.2,串口助手SSCOM V5.13.1。软件的下载安装有很多教程,大家可以自行搜索,本文只介绍如何利用这4种软件在proteus中实现arduino Mega 2560的串…

单片机学习13——串口通信

单片机的通信功能: 实现单片机和单片机的信息交换,实现单片机和计算机的信息交换。 计算机通信是指计算机与外部设备或计算机与计算机之间的信息交换。 通信有并行通信和串行通信两种方式。 在多微机系统以及现在测控系统中信息的交换多采用串行通信方…

12.7图欧拉回路与路径,图的一些性质,存储方式,图的遍历(有向图无向图BFSDFS)

欧拉回路与欧拉路径 存在条件 无向图存在欧拉回路的充要条件 一个无向图存在欧拉回路,当且仅当该图所有顶点度数都为偶数,且该图是连通图。 无向图存在欧拉路径的充要条件 当且仅当该图顶点度数为奇数的点的个数为0或者2。 欧拉定理二: 如果一个无向图…

sql注入漏洞--MYSQL两种思路

在学习之前,先自己搭建了一个网站 在前端可以实现与后端数据库的交互查询 创建一个数据库名为wy,表名为users 建立字段,定义类型 插入数据 INSERT INTO users(name, password,photo, money) VALUES ("DuZZ",123456,11,100); IN…

(三)基于高尔夫优化算法GOA求解无人机三维路径规划研究(MATLAB代码)

一、无人机模型简介: 单个无人机三维路径规划问题及其建模_IT猿手的博客-CSDN博客 参考文献: [1]胡观凯,钟建华,李永正,黎万洪.基于IPSO-GA算法的无人机三维路径规划[J].现代电子技术,2023,46(07):115-120 二、高尔夫优化算法GOA简介 高尔夫优化算法…

虚拟数据优化器VDO

本章主要介绍虚拟化数据优化器。 什么是虚拟数据优化器VDO创建VDO设备以节约硬盘空间 了解什么是VDO VDO全称是Virtual Data Optimize(虚拟数据优化),主要是为了节省硬盘空间。 现在假设有两个文件file1和 file2,大小都是10G。file1和 f…

Retrofit嵌套请求与适配器

一、前言: 1. retrofit嵌套请求 在实际开发中,可能会存在:需要先请求A接口,在请求B接口的情况,比如进入“玩android”网页请求获取收藏文章列表,但是需要先登录拿到Cookie才能请求搜藏文章几口&am…

【web安全】文件包含漏洞详细整理

前言 菜某的笔记总结,如有错误请指正。 本文用的是PHP语言作为案例 文件包含漏洞的概念 开发者使用include()等函数,可以把别的文件中的代码引入当前文件中执行,而又没有对用户输入的内容进行充分的过滤&#xff0…

添加新公司代码的配置步骤-Part3

原文地址:配置公司代码 概述 这是讨论创建新公司代码的基本标准配置步骤的第三篇博客。在第 1 部分中,我列出并讨论了企业结构中需要配置的项目。我随后提供了特定 FI 配置的详细信息。在本版本中,我将重点关注 SD 和 MM 模块。以下是这些博…

每日一题:LeetCode-11.盛水最多的容器

每日一题系列(day 13) 前言: 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 &#x1f50e…

低代码——“平衡饮食”才是王道

文章目录 一、低代码的概念二、低代码的优点2.1. 高效率与快速开发2.2. 降低技术门槛2.3. 适用于快速迭代与原型开发 三、低代码的缺点3.1. 定制性不足3.2. 深度不足3.3. 可能导致技术债务 四、低代码开发的未来4.1. 深度定制化4.2. 智能化 五、低代码会替代传统编程吗&#xf…

Python Struct 模块:二进制数据的强大解析与打包工具

更多资料获取 📚 个人网站:ipengtao.com Python中的struct模块是一个强大而灵活的工具,用于解析和打包二进制数据。本文将深入介绍struct模块的各个方面,通过丰富的示例代码,帮助读者更全面地理解和运用这一模块&…