Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

博主猫头虎的技术世界

🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能!

专栏链接

🔗 精选专栏

  • 《面试题大全》 — 面试准备的宝典!
  • 《IDEA开发秘籍》 — 提升你的IDEA技能!
  • 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师!
  • 《100天精通Golang(基础入门篇)》 — 踏入Go语言世界的第一步!
  • 《100天精通Go语言(精品VIP版)》 — 踏入Go语言世界的第二步!
  • 《21天精通IPV4 To IPV6》 — 踏入新IP时代的大门!

领域矩阵

🌐 猫头虎技术领域矩阵
深入探索各技术领域,发现知识的交汇点。了解更多,请访问:

  • 猫头虎技术矩阵
  • 新矩阵备用链接

在这里插入图片描述

文章目录

  • Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!
    • 关于 Gemini
      • 1. Gmail 中的 Gemini
      • 2. Gemini 1.5 Pro & Flash
      • 3. Gemini Live
      • 4. Gemini Nano
      • 5. Android 上的 Gemini
    • 新模型&项目
      • 1. Imagen3
      • 2. Veo 视频生成模型
      • 3. LearnLM 模型
      • 4. Project IDX
    • 应用&工具更新
      • 1. AI 在搜索中的应用
      • 2. 圈选搜索
      • 3. 在通话过程中检测诈骗
      • 4. 询问照片
      • 5. Firebase Genkit
      • 6. Google Play

Hello, 大家好!我是猫头虎,今天凌晨,Google I/O 开发者大会如期而至,持续了整整两个小时。相信很多朋友没有熬夜看发布会,所以我在这里为大家整理了一下重要内容,希望大家喜欢!

关于 Gemini

1. Gmail 中的 Gemini

Gmail 用户有福了,Gemini AI 将帮助大家更智能地搜索、总结和起草邮件。不仅如此,它还能处理复杂任务,例如搜索收件箱、查找收据和填写在线表格,非常适合处理电商退货等事务。

图片

2. Gemini 1.5 Pro & Flash

Gemini 1.5 Pro 新版本可以处理多达 200 万 token,比以前的容量翻倍。而针对要求较低的应用,Google 还推出了 Gemini 1.5 Flash,这是个“精炼”版本,适合高频生成 AI 工作负载,依然可以处理 200 万个 token 上下文窗口。

图片

3. Gemini Live

Google 还预览了 Gemini Live,让用户可以在智能手机上与 Gemini 进行“深入”的语音聊天。你可以在聊天中打断 Gemini,提出澄清问题,它会实时适应你的语音模式。还可以通过智能手机摄像头拍摄的照片或视频来让 Gemini 了解周围环境并做出反应。

图片

4. Gemini Nano

Gemini Nano 是最小的 AI 模型,将直接集成到 Chrome 桌面客户端中,让开发者可以在设备上使用模型来支持自己的 AI 功能。Google 计划利用这一新功能来增强 Gmail 中的“帮助我写作”工具。

图片

5. Android 上的 Gemini

Android 设备上的 Gemini 将成为 Google Assistant 的 AI 替代品。用户可以将 AI 生成的图像直接拖放到 Gmail、Google Messages 和其他应用程序中,还能从 YouTube 视频中查找特定信息。

图片

新模型&项目

1. Imagen3

谷歌推出了 Imagen 3 模型,相比前身 Imagen 2,它能更准确地理解文本提示并生成更创意和细致的图像。为防止深度伪造,Imagen 3 将使用 SynthID 技术应用不可见的加密水印。

图片

2. Veo 视频生成模型

Veo 是一个 AI 模型,可以根据文本提示创建大约一分钟长的 1080p 视频剪辑,能够捕捉不同的视觉和电影风格。谷歌计划探索故事板和生成更长场景的功能,以了解 Veo 的潜力。

图片

3. LearnLM 模型

谷歌推出了 LearnLM,一个针对学习进行“微调”的新生成 AI 模型系列,旨在“对话式”辅导学生一系列科目,已经在 Google 的多个平台上使用,正在通过 Google Classroom 的试点项目进行试用。

图片

4. Project IDX

Project IDX 是谷歌的下一代、以 AI 为中心、基于浏览器的开发环境,现已进入公开测试阶段。它是一种多平台开发体验,可以快速构建应用程序,集成了 Google Maps Platform、Chrome 开发工具和 Lighthouse,并支持 Cloud Run 的部署。

图片

应用&工具更新

1. AI 在搜索中的应用

谷歌为搜索构建了定制的 Gemini 模型,将实时信息、谷歌排名、长上下文和多模态特征结合在一起。这个 AI 驱动的搜索概述功能已经在美国向“数亿用户”推出,目标是在今年年底前向超过 10 亿人提供服务。

图片

2. 圈选搜索

由 AI 驱动的“圈选搜索”功能允许 Android 用户通过圈选、突出显示等手势立即获得答案,现在能解决更复杂的心理学和数学应用题。

图片

3. 在通话过程中检测诈骗

Google 将在未来的 Android 版本中内置一个功能,利用 Gemini Nano 实时检测诈骗对话模式,并提醒用户注意潜在的诈骗。

图片

4. 询问照片

Google Photos 推出了一项新功能“Ask Photos”,允许用户使用自然语言查询来搜索照片集,利用 AI 对照片内容和元数据的理解,让搜索更直观。

图片

5. Firebase Genkit

Firebase 平台新增了一个名为 Firebase Genkit 的功能,旨在让开发人员更轻松地使用 JavaScript/TypeScript 构建 AI 驱动的应用,并即将支持 Go 语言。

图片

6. Google Play

Google Play 增强了应用发现功能、用户获取方式,并推出了 Play Points 更新和开发者工具(如 Google Play SDK Console 和 Play Integrity API),为开发者提供更多支持。

图片


这次 Google I/O 发布的内容真是干货满满啊!Gemini 系列不仅覆盖了邮件、搜索、浏览器等多个场景,还推出了多种新模型和工具,期待未来这些功能能给我们的生活和工作带来更多便利。

我是猫头虎,感谢大家的阅读,我们下期再见!

在这里插入图片描述

👉 更多信息:有任何疑问或者需要进一步探讨的内容,欢迎点击下方文末名片获取更多信息。我是猫头虎博主,期待与您的交流! 🦉💬

🚀 技术栈推荐
GoLang, Git, Docker, Kubernetes, CI/CD, Testing, SQL/NoSQL, gRPC, Cloud, Prometheus, ELK Stack

💡 联系与版权声明

📩 联系方式

  • 微信: Libin9iOak
  • 公众号: 猫头虎技术团队

⚠️ 版权声明
本文为原创文章,版权归作者所有。未经许可,禁止转载。更多内容请访问猫头虎的博客首页。

点击下方名片,加入猫头虎领域社群矩阵。一起探索科技的未来,共同成长。

🔗 猫头虎社群 | 🔗 Go语言VIP专栏| 🔗 GitHub 代码仓库 | 🔗 Go生态洞察专栏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/703275.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

tomcat启动闪退解决办法

tomcat启动闪退解决办法 1. 端口号被占用2. 检查电脑环境配置2.1 如何配置电脑的环境变量? windows系统下,tomcat安装好以后,双击bin文件下startup.bat后,tomcat没能按照预期打开,反而闪退了。 导致这种情况发生&…

【二叉树】(二)二叉树的基础修改构造及属性求解1

(二)二叉树的基础修改构造及属性求解1 翻转二叉树递归实现迭代实现(深度遍历)层序实现(广度遍历) 对称二叉树递归实现迭代实现(非层序遍历) 二叉树的最大深度递归法迭代法&#xff0…

C++进阶:哈希(2)位图与布隆过滤器

目录 1. 位图(bitset)1.1 引子:海量整形数据的处理1.2 结构描述1.3 位图实现1.4 位图相关题目练习 2. 布隆过滤器(BloomFilter)2.1 引子:海量非int类型数据处理(string)2.2 结构描述…

紫光展锐先进技术科普 | 工业互联网遇到5G,1+1>2?

随着工厂自动化的加速普及,如今我们可能经常看到这样的场景:在高温、潮湿、粉尘、腐蚀等恶劣环境作业场景,巡检机器人穿梭其中,工人们不必弯腰去搬沉重又危险的器件,而旁边会有一个个机械臂帮手平稳有序地完成好所有搬…

性能测试工具—jmeter的基础使用

1.Jmeter三个重要组件 1.1线程组的介绍: 特点: 模拟用户,支持多用户操作多个线程组可以串行执行,也可以并行执行 线程组的分类: setup线程组:前置处理,初始化普通线程组:编写…

Redis:string类型

文章目录 string基本认识重谈set重谈getmset和mgetsetnx/setex/psetexincr系列命令字符串其他操作string的编码方式string的应用场景缓存功能session会话手机验证码 本篇开始总结的是Redis中的string类型 string基本认识 Redis中的string来说,所有的key都是字符串…

Java数据类型:基本数据类型

Java是一种强类型语言,定义变量时,必须指定数据类型。 // 变量必须指定数据类型 private String username;初学者不免有个疑问:在实际编写代码的过程中,该如何选择数据类型呢? 回答这个问题之前,先来解决…

构建智能制造时代的制造行业数据中台总体架构

随着数字化技术的快速发展和智能制造的兴起,制造行业正面临着前所未有的机遇和挑战。在这一背景下,构建制造行业数据中台成为推动制造业转型升级的重要战略举措。本文将深入探讨制造行业数据中台的总体架构,助力制造企业把握数字化转型的主动…

vsCode 设置上下级文件夹目录分离展示?

默认情况下,vsCode目录文件夹会使用/合并展示在一行,这样视觉上看着并不直观,设置目录文件分离展示方法如下: 1、点击左下角设置图标,点击setting; 2、搜索栏输入compact; 3、取消勾选第一个选…

MySQL存储引擎介绍

查看MySQL数据库中创建表的信息 如上图所示,当我们使用命令show create table server_info\G;可以显示我们所创建的表的信息,只显示两个字段,第一个字段是Table 即是创建的表的名称,第二个字段是Create Table即是创建的表的字段的…

Spring Boot集成activiti快速入门Demo

1.什么事activiti? Activiti是一个工作流引擎,可以将业务系统中复杂的业务流程抽取出来,使用专门的建模语言BPMN2.0进行定义,业务流程按照预先定义的流程进行执行,实现了系统的流程流activiti进行管理,减少业务系统由于流程变更进行系统升级改造的工作量,从而提高系…

东方伟大思想家和哲学家颜廷利:有形的财富越与无形的财富

在世界的广阔舞台上,财富常被看作衡量国家与民族成就的重要尺度。然而,在物质和精神的天平上,真正具有深远意义的,往往是后者的累积与扩散。正如东方哲学的现代诠释者、当代中国教育界的杰出教授颜廷利所阐述,“有形的…