Google发布了它所称的“推理”AI模型

news/2025/3/10 14:51:34/文章来源:https://www.cnblogs.com/jellyai/p/18620529

Google发布了它所称的“推理”AI模型——但这还处于实验阶段,根据我们简短的测试,显然仍有改进空间。

这个新模型名为Gemini 2.0 Flash Thinking Experimental(名字有点长,确实),可以在Google的AI原型平台AI Studio中使用。模型卡片描述它是“最适合多模态理解、推理和编程”的,具有在编程、数学和物理等领域“推理解决最复杂问题”的能力。

在X上的一篇帖子中,负责AI Studio产品的Logan Kilpatrick称Gemini 2.0 Flash Thinking Experimental是“[Google]推理之旅的第一步”。Google DeepMind的首席科学家Jeff Dean在他自己的帖子中表示,Gemini 2.0 Flash Thinking Experimental是“经过训练,利用思考来增强其推理能力”。

“当我们增加推理时间计算时,看到了一些有希望的结果,”Dean表示,他指的是在考虑问题时,模型所使用的计算量。

基于Google最近发布的Gemini 2.0 Flash模型,Gemini 2.0 Flash Thinking Experimental在设计上似乎与OpenAI的o1以及其他所谓的推理模型相似。与大多数AI不同,推理模型能有效自我事实核对,这帮助它们避免了通常会让AI模型陷入的陷阱。

作为一种缺点,推理模型通常需要更长时间——通常是几秒到几分钟的时间——才能得出解决方案。

TC会议:AI

加入1200位科技领袖,参加在TechCrunch Sessions:AI上的一整天主舞台会议、分组讨论和网络交流。加入候补名单,成为第一批提前注册的人。

Zellerbach Hall,UC Berkeley | 2025年6月5日

加入候补名单

给定一个提示,Gemini 2.0 Flash Thinking Experimental在回应之前会暂停,考虑多个相关提示并“解释”其推理过程。过一段时间后,模型会总结出它认为最准确的答案。

好吧——这应该是发生的事情。当我问Gemini 2.0 Flash Thinking Experimental“草莓”这个词里有几个“R”时,它回答是“两个”。

Google推理模型

Google的新推理模型在计数字母时有时会遇到困难。

                                    图片来源:Google

你的体验可能会有所不同。

在o1发布之后,竞争对手AI实验室的推理模型如雨后春笋般涌现——不仅仅是Google。11月初,DeepSeek,一家由量化交易员资助的AI研究公司,发布了其首个推理模型DeepSeek-R1的预览。同月,阿里巴巴的Qwen团队推出了他们声称是第一个“开放”版本的o1挑战者。

彭博社在10月报道,Google有多个团队在开发推理模型。随后《信息》网站的报道显示,Google至少有200名研究人员专注于这项技术。

是什么打开了推理模型的大门?嗯,一方面是寻找新的方法来改进生成型AI。正如我的同事Max Zeff最近报道的,“蛮力”技术已经无法像以前那样推动模型的规模化进展。

并不是每个人都确信推理模型是最好的发展方向。首先,它们往往很昂贵,因为运行它们需要大量的计算能力。而且虽然它们在基准测试中表现良好,但目前尚不清楚推理模型是否能够保持这样的进展速度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/856266.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Python GUI 编程】tkinter :Ttk 组合框 Combobox

在本文中,将介绍如何创建一个 tkinter Combobox 组合框小部件,该小部件允许用户从一组值中选择一个值。 Combobox 组合框小部件是新增的 Ttk 主题小部件,是 Entry 文本框和 Listbox 列表框的组合。除了允许在一组值中选择一个值外,它还允许输入自定义值。 创建组合框 要创建…

【Python GUI 编程】tkinter:Ttk 选项卡 Notebook

在本文中,将介绍如何使用 Tkinter Notebook 小部件创建选项卡。 Notebook 是由 Tkinter Ttk 模块引入的强大小部件。允许开发者创建包含多个选项卡的界面,每个选项卡可以包含不同的内容。 创建 Notebook 小部件,请使用如下构造函数: notebook = ttk.Notebook(master,**kw)添…

在虚拟机里执行protoc报非法指令( Illegal instruction)

问题 在x86虚拟机里编译perfetto的时候遇到执行protoc报非法指令,但是在host上编译的时候并没有这样的问题 原因 虽然虚拟机和宿主机都是同一个指令集架构,但是CPU在一些特殊指令上的支持还是有区别的,如果Host可以,但是虚拟机上不行,可能就是虚拟机CPU不支持某些特性,导…

中考阅读理解深入逻辑分析-001 A Dine to Remember 难忘的一餐

中考阅读理解深入逻辑分析-001 A Dine to Remember 难忘的一餐 文章正文 It was a few years ago. A friend had sent me a restaurant gift card for Christmas and I had picked a sunny Sunday afternoon to use it. It felt good taking my two grown sons and daughter to…

HTTP协议及安全防范

HTTP(Hypertext Transfer Protocol)超文本传输协议是一个用于 Web 应用程序通信的应用层协议。它是一种客户端-服务器协议,客户端通过发送请求到服务器来获取资源,服务器则根据请求返回响应。HTTP 协议通常使用 TCP作为传输协议,但也可以使用其它传输协议 由于图片解析问题…

LDA主题模型——原理和模型(二)

img { display: block; margin-left: auto; margin-right: auto } table { margin-left: auto; margin-right: auto } 主题模型是用于发现文档集合中隐含主题的统计模型,主题可以定义为“文档集中具有相同词境的词的集合模式”。主题模型克服了传统信息检索中文档相似度计算方…

LDA主题模型——贝叶斯分布与其共轭(一)

img { display: block; margin-left: auto; margin-right: auto } table { margin-left: auto; margin-right: auto } 贝叶斯分布理论是统计推断的重要分支,其核心思想是利用贝叶斯定理,将先验知识与新观测数据结合,从而动态更新对未知参数的认识。这一理论框架以概率为基础…

pytest+requests+allure测试框架中,如何实现用例的数据驱动取出来的数据同步到fixture中,作为参数使用

1、在 pytest 中,如果你有多个数据驱动的 fixture 和测试用例,并希望确保它们的数据同步传递(即每个 fixture 和测试用例的数据对是一一对应的),你可以使用 pytest.mark.parametrize 来参数化测试函数和 fixture。为了确保 fixture 和测试函数中的数据同步传递,可以将它们…

webman: 使用模板引擎twig

一,安装 $ composer require twig/twig 二,配置 config/view.php <?php /*** This file is part of webman.** Licensed under The MIT License* For full copyright and license information, please see the MIT-LICENSE.txt* Redistributions of files must retain th…

读图数据库实战笔记09性能与反模式

性能与反模式1. 熵 1.1. 熵是物理学上的一个术语,本质上是一个系统“内在的混乱程度”​ 1.2. 是我们的敌人 2. 执行缓慢的遍历 2.1. 和关系数据库一样,图数据库对于执行缓慢的操作并不陌生 2.2. 图也有帮助诊断问题的工具2.2.1. 解释一个遍历会做什么2.2.2. 分析一个遍历做了…

广义少镜头分割的视觉提示:一种多尺度方法

广义少镜头分割的视觉提示:一种多尺度方法 5.5.1 多尺度方法概述 基于注意力的变换器模型的出现,由于其优越的泛化和传递特性,在各种任务中得到了广泛的应用。最近的研究表明,当得到适当的提示时,这些模型对于少镜头推理来说是极好的。然而,对于语义分割等密集预测任务,…