昨晚 Google 发布了史上最强人工智能模型:Gemini。
Google CEO Sundar Pichai CEO 说 Gemini 时代是 Google 新时代的开始。
Gemini 是 Google 最新的大型语言模型,Pichai 首次在 6 月的 I/O 开发者大会上透露了这一消息,如今正式公开发布。根据 Pichai 和 Google DeepMind CEO Demis Hassabis 的描述,这是 AI 模型的一次巨大飞跃,最终将影响几乎所有的 Google 产品。Pichai 表示:“这一刻的强大之处在于你可以致力于一项基础技术的改进,它会立即在我们的所有产品中产生影响。”
Gemini 不仅仅是一个单一的 AI 模型。它有 Gemini Nano、Gemini Pro 和 Gemini Ultra 三个版本。Gemini Nano 主要是在 Android 上运行;Gemini Pro 用来驱动 Google 的 AI 服务,比如现在就可以在 Bard 上试用;而 Gemini Ultra 被称之为 Google 史上最强大的大语言模型(LLM),主要用于数据中心和企业级应用。
Gemini 的三个不同量级的模型
谷歌以不同的方式推出不同的模型:Gemini Nano 支持的是 Pixel 8 Pro 用户;Gemini Pro 目前支持的是 Bard 用户;Gemini Ultra 将在明年推出。开发者和企业级客户将能够从 12 月 13 日开始通过 Google Cloud 上的 Google Generative AI Studio 或者 Vertex AI 来使用 Gemini Por 服务。目前 Gemini 只支持英语,但是很快会支持其他语言。Pichai 表示,这个模型最终将被整合到谷歌的搜索引擎、广告产品、Chrome 浏览器等全球范围内。它是谷歌的未来,而且它来得正是时候。
一年多前,OpenAI 推出了 ChatGPT,该公司和其产品 ChatGPT 立即成为人工智能领域最火热的事物。现在,谷歌—这家为当前人工智能繁荣发展提供了许多基础技术的公司,近十年来一直自称为“人工智能为先”的组织,但是却被 ChatGPT 给了当头一棒,现在 Google 终于开始反击了。
谈及到和 OpenAI GPT-4 的对比,Hassabis说道“我们对这两个系统进行了非常彻底的比较和基准测试”。谷歌运行了32个成熟的基准测试,全面比较了这两个模型,从全面的多任务语言理解基准测试到比较两个模型生成 Python 代码的基准测试。“我认为在这32个基准测试中,我们在30个基准测试上都领先一大截”,Hassabis笑容满面地说,“其中一些非常狭窄,而另一些则更为广泛。”
在 32 项基准测试中,Gemini 在 30 项中超越了 GPT-4
在这些基准测试中(实际上它们大多数都非常接近),Gemini 的最明显优势来自其理解和与视频以及音频交互的能力。这在很大程度上是有意设计的:多模态一直是Gemini计划的一部分。谷歌并没有像 OpenAI 创建 DALL-E 和 Whisper 那样为图像和语音训练独立的模型;它从一开始就构建了一个多感官模型。“我们一直对非常通用的系统感兴趣,”Hassabis说。他尤其关注的是如何将这些模式混合起来—从任意数量的输入和感知中收集尽可能多的数据,然后以同样多样化的方式进行回应。
图文基准测试结果
多模态基准测试结果
目前,Gemini最基本的模型是文本输入和文本输出,但像Gemini Ultra这样更强大的模型可以处理图像、视频和音频。“它将变得更加通用,”Hassabis说。“仍然有一些东西,比如动作和触摸——更像是机器人类型的事物。”随着时间的推移,他表示,Gemini将获得更多的感知,变得更加意识到周围环境,并在这个过程中变得更加准确和扎实。“这些模型在某种程度上更好地理解了周围的世界。”当然,这些模型仍然可能产生幻觉,而且它们仍然存在偏见和其他问题。但Hassabis表示,它们了解得越多,表现就会越好。
Gemini 能更好的理解周边环境
尽管基准测试只是基准测试,但最终,对于Gemini的能力来说,真正的测试将来自那些希望能够使用 Gemini 来产生创意、查找信息以及编写代码的日常用户。Google 认为编码是 Gemini 的一个杀手级使用场景,它使用了一种新的代码生成系统 AlphaCode 2,其性能优于 85% 的编码竞赛参与者,而且比 AlphaCode 有了 50% 的性能提升。
Google 将Gemini 的发布视为更大项目的开始,也视为 Google 自身的一次重大改变。Gemini是谷歌一直在等待的模型,是多年来一直在努力构建的模型,甚至可能是在OpenAI和ChatGPT主导世界之前就应该准备好的模型。
在 ChatGPT 推出后,Google 发布了“红色警报”,这之后谷歌似乎一直在试图紧随其后,而且一直在努力地迎头赶上。然而,谷歌似乎仍然试图坚守其“大胆而负责任”的口号。Hassabis和Pichai都表示,他们不愿意过快行动,尤其是在我们接近最终的人工智能梦想时:人工通用智能,这是指一种能够自我改进、比人类更聪明且准备改变世界的人工智能。Hassabis说:“随着我们接近AGI,事情将会有所不同。这是一种主动的技术,所以我认为我们必须谨慎对待。谨慎,但乐观。
谷歌表示已经努力确保Gemini的安全性和责任性,而且通过了内部和外部测试以及红队测试。Pichai指出,确保数据安全性和可靠性对于以企业为先的产品尤为重要,而这正是大多数生成式人工智能赚钱的地方。但Hassabis承认,推出一款尖端的人工智能系统的风险之一是它可能会出现无法预测的问题和攻击向量。“这就是为什么你必须发布这些东西,”他说,“以便观察和学习。”谷歌对Ultra版本的发布采取了特别慎重的步伐;Hassabis将其比作受控的测试版,为谷歌最强大且无拘束的模型提供了一个“更安全的实验区”。基本上,如果在Gemini里有一个破坏婚姻的另类人格,谷歌希望在用户发现之前找到它。
多年来,Pichai和其他谷歌高管一直在歌颂人工智能的潜力。Pichai本人不止一次表示,人工智能将对人类产生比火或电更为深远的变革。在这第一代中,Gemini模型可能不会改变世界。最乐观的情况是,它可能只是帮助谷歌在建设出色的生成式人工智能的竞赛中赶上OpenAI(最糟糕的情况是,Bard仍然平庸无奇,ChatGPT继续占据主导地位)。但是Pichai、Hassabis以及谷歌的所有其他人似乎都认为这只是一切真正巨变的开始。
互联网使谷歌成为科技巨头;Gemini可能会更加庞大。
AI 如何驱动 DevOps
随着 AIGC 的快速发展,AI 已经开始加速渗透各行各业,DevOps 就是一个典型的领域。作为一体化 DevOps 平台领域的领头羊— GitLab,已经在 AI 与 DevOps 的结合方面,落地了很多功能。比如使用 AI 来解释代码、解释漏洞、推荐代码审核人员等。目前已经成为业界领先的 AI 驱动的一体化 DevSecOps 平台。
由于这些出色的创新能力,GitLab 第三季度的财报也是相当亮眼:第三季度同比增长 32%。
作为 GitLab 在中国的发行版—极狐GitLab,目前正推出了 60 天专业版免费试用的政策。所有用户、企业都可以体验业界领先的一体化 DevSecOps 平台。