一天就被刷屏了。
google发布Gemini多模态大模型,还发布了一个几分钟的视频,我相信看完视频都会说一句:NB。
视频可以去B站或者其他地方搜 Gemini。
感觉机器不仅有脑子了,还长眼睛了。
Gemini是原生多模态大模型,是谷歌大模型新时代的第一步,它包括三种量级:能力最强的Gemini Ultra,适用于多任务的Gemini Pro,以及适用于特定任务和端侧的Gemini Nano。
感觉这命名和苹果一样…
OpenAI这一年以来独领风骚,Google估计是拼命追赶,终于憋出来个大招,其实时间已经很快很快了,现在AI基础的这方向,小公司玩不起,得超级大公司整。
看别的文章说Gemini对中文的理解已经赶上甚至超过了ChatGPT-4,各方面测试数据,官方给了表格:
自己写的反正是几乎全部超过了GPT-4。
还给了个google自己用的TPU的机房照片,看着很多:
在产品这方面,官方也写了,我简单总结一下:
1、谷歌产品里的Gemini Pro模型
现在开始,会提供可微调的Gemini Pro版本,目前是支持英文以及支持170个多个国家和地区,当然,未来计划会支持更多的语言和地区。
然后会把Gemini放到Pixel手机上,Pixel 8 pro是第一款搭载Gemini Nano的智能手机,拥有一些强大的特性,比如能总结录音app里的内容,还会在放到GBoard的智能回复里,从Whatsapp开始,明年会放到更多消息类应用。
在未来几个月,Gemini将在更多我们的产品里使用,比如搜索、广告、chrome还有Duet AI。
2、用上Gemini
从12月13日开始,开发者和企业客户能通过Google AI Studio或者Cloud Vertex AI用Gemini API来使用Gemini Pro。
安卓开发者也能用Gemini Nano来构建应用,一些新的支持特性在Android14可用,并且从Pixel 8Pro手机开始。
3、Gemini Ultra
Gemini Ultra也快来了,还在做最后的测试。
明年我们会发布使用Gemini Ultra Bard Advanced,一个新的前沿AI体验,它能让你用上最好的模型和能力。
有人说Bard已经用了Gemini,我就去Bard上试了下,现在是免费的,有谷歌账号就能用了,回答的感觉还不错。
最终这个Gemini能有多厉害,可以试试