外网讨论疯了的神秘模型Q*(Q-Star)究竟是什么?OpenAI的AGI真的要来了吗 | 详细解读



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

这几天,关于 OpenAI 首席执行官山姆·奥特曼的 "被解雇" 风波闹得沸沸扬扬,目前奥特曼已经重回 OpenAI,事件似乎逐渐有收场的趋势。我之前也写过几篇文章进行数理、分析和解读,可以回顾一下,

  • 《详细梳理山姆·奥特曼离职闹剧 仍试图重返OpenAI》
  • 《OpenAI | 解雇奥特曼后 ChatGPT将何去何从》

但是回过头来看,大家才反应过来,之前一直都是在看好戏、在看奥特曼的表态、在看微软的表态,似乎忽略了一个重要因素,那就是为啥 Ilya Sutskever 一开始会这么 "反常" 将奥特曼扫地出门呢?从整个事件来看,Sutskever 并不是想夺权,而确实像之前一直报道的是 "为了 AI 的安全"。所以,真的要不是受到了什么刺激,估计 Sutskever 并不会这么 "反常"、这么 "固执己见"。那这个刺激到底是什么呢?现在似乎有了答案,一切的一切可能都是因为 Q-Star -> 这个被 Sutskever、被多名 OpenAI 研究人员认为可能成长为真正 AGI 的模型,一个可能会对全人类造成威胁的模型。

那么从这个角度来说,Q-Star 应该就是 GPT 的下一代,它的定位有可能是 GPT4.0 到 GPT5.0 的过渡,也有可能直接就是 GPT5.0。其实不管是哪一代,其实都有很明显的信号,那就是 OpenAI 认为 GPT5.0 可能真的意味着 AGI 的到来。GPT4.0 的下一代 (也就是这里的 Q-Star) 智力水平肯定十分强大,这种强大是能够让人觉得后怕的那种。这也许就是为什么以 Sutskever 为首的 "保守派" 相当固执地致力于它的安全性、希望能够谨慎使用它,这种 "执念" 不惜让他萌生赶走 "激进派" 的奥特曼。但后来 Sutskever 估计也没有意识到,奥特曼的离职风波会闹的这么大、这么不可收场,而且是深深伤害了 OpenAI,所以他后来态度 180 度大转弯,转而 "支持" 奥特曼重返 OpenAI。当然, Sutskever 的这种 "支持" 绝对不会是 "服服帖帖" 的支持,而是不希望看到 OpenAI 继续受到如此大的伤害。

奥特曼和 Sutskever 思考的方式不一样,奥特曼以推进 OpenAI AGI 技术的快速发展而自豪,为 OpenAI 的资本扩张而努力;而 Sutskever 也是为 OpenAI AGI 技术的快速发展而自豪,但他不太会过多地去考虑资本市场,在他的层次、从他的角度,会更加多地考虑 AI 安全,这点也是很能让人理解的。

这么一来,其实奥特曼整个离职风波的前因后果都理顺、讲得通了。

再回过头来看 Q-Star,我去翻了一圈外网,相关的报道其实并不算多,大多也还是停留在大家的猜测上。路透社最先报道了 "OpenAI 研究人员警告董事会在首席执行官被罢免之前的 AI 突破",这里就是指的 Q-Star。随之华尔街见闻也跟着报道 "警告 AI 重大新突破或危及人类"。两家知名网站的揭露,一下子就把 Q-Star 可能成长为 AGI、威胁人类的论调推向了高潮。

说说我的观点,Q-Star 应该是数学能力上有了突破,Q-Star 从命名上来看可能与强化学习中的 Q-learning 算法有关,这是一种评估在特定情境下采取特定行动并反馈好坏的方法,其中会涉及 Q-Value 和 Bellman 方法,这些都是强化学习中的重要概念,可以用于指导 AI 在不同情境下做出最优决策。如果是这样,可能 Q-Star 中已经融入一部分的强化学习技术,大家应该知道,强化学习是一种典型的 反馈-学习 的技术,是实现在线学习的一种途径。但是考虑到算力消耗,要真正实现在线学习,几乎是不可能的。

我其实对于目前大模型的这种方式来实现 AGI 表示怀疑,我心目中的 AGI 所依赖的算力功耗不应该是目前这么庞大的,这就像人脑一样,咱们的智力水平这么高但是功耗却很低。我心目中真正的 AGI 应该是那种低功耗却能提供无穷无尽的智力,它可以一开始一无所知,但是它能够超级快速地自我学习、自我反馈。这种模式可以借用咱们国产大模型厂商的一个名字,我觉得取得挺好,那就是 "零一万物",零生一、一生万物。在这样的角度下,目前拥有的不管是 OpenAI 的 GPT 模型,还是 Meta 的 LLaMA 模型,都不是那种 "理想形态"。这主要体现在,一是它们消耗的算力实在过于庞大,这就像一堆二愣子堆出来一个小孩子一样;二是它们对于开放世界的在线学习能力特别有限,甚至是没有,现在多是借助外挂。目前你要想让它们像咱们人脑一样实时在线学习,那是不可能的,所以这根本不像 AGI 的生存形态

现在的基于 Transformer 的大模型算力依旧是依靠晶体管的堆叠,这种冯诺依曼的架构在超高算力场景下的 "各种墙",比如存储墙、比如功耗墙,注定不会让算力无止尽。你不要看英伟达现在如此风光,明年要发布的新一代 GPU 性能多么地 "无止尽",需要清楚的是现在认为的算力高,只是堆出来的,并没有本质上解决低功耗超高算力的问题。

而我会更加看好量子计算、量子机器学习、类脑计算的研究 (存内计算也许算一种过渡但也不算终极答案,但是存内计算会比现在的计算模式更加先进,这点毋庸置疑),也许未来还有其他方向的研究,但实现 AGI 绝对不会是目前的这套解决方案。所以从我的角度,Q-Star 不会是 AGI,要实现 AGI,不仅仅是目前这套深度学习模型架构还得换代 (这种换代就像是从卷积神经网络换代到 Transformer 一样,Transformer 还得继续换代到下一代),而且算力提供的方式也得换代 (基于晶体管的堆叠,对于无穷尽的算力需求是不可能实现的)。要实现 AGI,绝没有这么简单,也没有这么快。

或许,几年后回过头来看,Q-Star 可能只是一个知识能力更强的 GPT 模型而已,而它也只是一次顺着 "离职风波" 热度的商业炒作罢了。

当然,毫无疑问的是,OpenAI 依旧是最接近 AGI 的组织。


【极智视界】

《外网讨论疯了的神秘模型Q*(Q-Star)究竟是什么?OpenAI的AGI真的要来了吗 | 详细解读》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球,星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。https://t.zsxq.com/0aiNxERDq

​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/214657.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NX二次开发UF_CSYS_map_point 函数介绍

文章作者:里海 来源网站:https://blog.csdn.net/WangPaiFeiXingYuan UF_CSYS_map_point Defined in: uf_csys.h int UF_CSYS_map_point(int input_csys, double input_point [ 3 ] , int output_csys, double output_point [ 3 ] ) overview 概述 Ma…

【腾讯云云上实验室】探索保护数据之盾背后的安全监控机制

当今数字化时代,数据安全成为了企业和个人最为关注的重要议题之一。随着数据规模的不断增长和数据应用的广泛普及,如何保护数据的安全性和隐私性成为了迫切的需求。 今天,我将带领大家一起探索腾讯云云上实验室所推出的向量数据库&#xff0c…

git 对已有的项目代码建立github仓库

首先在项目根路径下使用以下命令初始化git配置文件; git init关联github仓库地址,我这里使用的是SSH连接方式; git remote add origin gitgithub.com:xxxxx.git关联main分支,其中current_branch代表着你需要push的分支&#xff…

小学语文老师重点工作

小学语文老师是学生在语言学习过程中的关键引导者,他们的主要职责是帮助学生建立正确的语言基础,培养良好的阅读习惯,并提高学生的语文素养。以下是小学语文老师的一些重点工作。 一、教授语言知识 小学语文老师首要的任务是教授学生语言知识…

zerotier 入门及初始使用

官网终端下载地址 https://www.zerotier.com/download/ 配置 创建网络 到默认的控制中心创建网络 https://my.zerotier.com/ 点击进入,将网络ID复制 加入网络 MacOS 将上面的网络ID复制到下方进行输入 Windows Linux # xxxxxxxxxxxxxx 网络节点ID sudo zerotier-cli join xx…

ResizeObserver loop limit exceeded报错解决方案

前言: 控制台没有报错,但是开发Vue项目过程中一直报ResizeObserver loop limit exceeded 错,找到以下解决方式。在main.js文件中重写 ResizeObserver 方法。 main.js文件 (完整版) import { createApp } from "v…

Django QuerySet.order_by SQL注入漏洞(CVE-2021-35042)

漏洞描述 Django 于 2021年7月1日发布了一个安全更新,修复了函数QuerySet.order_by中的 SQL 注入漏洞。 参考链接: Django security releases issued: 3.2.5 and 3.1.13 | Weblog | Django 该漏洞需要开发人员使用order_by功能。此外,还可…

手动实现 git 的 git diff 功能

这是 git diff 后的效果,感觉挺简单的,不就是 比较新旧版本,新增了就用 "" 显示新加一行,删除了就用 "-" 显示删除一行,修改了一行就用 "-"、"" 显示将旧版本中的该行干掉了并…

【分布式】分布式中的时钟

一、物理时钟 vs 逻辑时钟 时钟的存在主要是为了标识事件的发生顺序。 分布式系统不使用物理时钟记录事件,分布式系统中每个节点记录的时间并不一样,即使设置了 NTP 时间同步节点间也存在毫秒级别的偏差 所以需要有另外的方法记录事件顺序关系&#x…

盘点43个Python登录第三方源码Python爱好者不容错过

盘点43个Python登录第三方源码Python爱好者不容错过 学习知识费力气,收集整理更不易。 知识付费甚欢喜,为咱码农谋福利。 项目名称 bnuz中国电信校园网模拟登录,python selenium BNUZ教务系统认证爬虫Python语言实现,你可以用…

Windows IDEA Python开发环境安装+爬虫示例

文章目录 Python下载安装开发工具IDEA包管理安装pip基本用法从 requirements.txt 安装依赖 项目示例部署在 Linux 上安装Python在 Linux 上创建虚拟环境:安装依赖:运行你的爬虫 Python下载安装 Python 安装包下载地址:https://www.python.or…

windbg双机调试

1:虚拟机增加串行端口 2:操作步骤:编辑虚拟机设置 -> 添加 -> 串行端口 -> 完成 参数配置:使用命名管道 -> \\.\pipe\com_1 -> 该端是服务器,另一端是应用程序 -> 轮询时主动放弃CPU->确定 3 -b…