AI 应用之路:质疑汤姆猫,成为汤姆猫,超越汤姆猫

过去一年,我对 AI 应用的看法经历了这样一个过程:质疑汤姆猫,理解汤姆猫,成为汤姆猫,超越汤姆猫。

什么是汤姆猫?汤姆猫是 2010 年移动互联网早期的一款应用,迅速走红,又淡出视野。这是一个比喻,指代那些很好玩,一度成为现象级,但没有长期留存的产品。拍出海马体的妙鸭相机,让郭德纲说英文相声的 Heygen,都有点 AI 时代汤姆猫的意思。

坦率讲,最开始我是质疑汤姆猫的,这类产品一度热闹,但玩法单一,没有长期留存率,很难持续。在写的《今天的AI创业,与移动互联网时代的区别在哪里?》中,有一段对汤姆猫的讨论:

一个平台从 1 岁走到黄金年龄,会经历很多真伪机会。回头看移动互联网的早期,有四类机会都曾霸榜。

……

第二类机会叫「汤姆猫」,是小机会。汤姆猫很巧妙的用到了手机的麦克风,你说什么话,它就会用猫的语气来复述。当时日下载量到了百万级别,但没有长期留存率,因为玩法单一,和猫对话几天后就没有新鲜感了。后来汤姆猫被中国的一家上市公司收购了,作价 70 亿人民币。

今天在 AI 的早期阶段,摆在我们眼前的依然是这四类机会,我们需要想清楚,谁是 AI 时代的手电筒,谁是 AI 时代的抖音快手。基于大模型的套壳应用是新时代的手电筒,很短的时间就会被大模型的能力击穿;基于 AI 做出的一些原生小爆款应用,如果玩法过于单一,无法形成自己的资产,很可能成为新时代的汤姆猫;

后来为什么理解汤姆猫了?因为更理解大模型的能力边界,和当下所处的阶段了。

01

理解汤姆猫,

是因为理解了当下大模型的能力边界

图片

大模型的发展规律和互联网有很大差异,更应该参照芯片行业的发展规律。

50 年代,仙童发明了半导体后,随着芯片能力的提升,先后出现了计算器、PC、游戏机、移动手机、MP3、智能手机这些国民级的电子产品,这背后是摩尔定律的推动,「处理器的性能每两年翻一倍,价格下降为之前的一半」。

这些电子产品横跨几十年,依次解锁,半导体刚出来的时候,它的能力只能用来做计算器,随着计算能力的提升,才能造出 PC。

OpenAI 推出 ChatGPT 只有一年多时间,基于大模型的应用的出现也是有先后顺序的,在要出计算器、随身听的时候,不要硬造 PC;在要出汤姆猫的时候,不要硬造抖音,造不出来。历史无法跳跃,只能经历。

Scaling Law 会成为 AI 时代的摩尔定律,堆算力,堆参数。随着模型能力的提升,基于大模型不是造应用,而是造虚拟人,起初是本科生,之后是白领,之后是某些领域的专家比如医生、律师,后面会造出科学家,最终极的形态是 AGI,随着模型智能程度的提升,这些虚拟人会依次解锁。

以造人的标准来看待当下大模型的能力,就知道需要多少智能,和中间的差距了。

而现在我们常说的「AIGC 应用」,可能只是 AI 发展史上的过渡阶段,是因为当下的模型还造不出虚拟人,所以先造辅助软件。

02

成为前千分之一的汤姆猫,

完成能力蜕变

理解汤姆猫后,我认为应该尽快「成为汤姆猫」,且做前千分之一的汤姆猫。

这缘于我的一个观察。

和很多投过的早期项目相处后,我发现创始人的能力不是线性增长,而是跳变的,忽然之间上了很大一个台阶,可能就一个月时间,隔壁老王已经不是我认识的老王,我得管他叫王哥了。

发生跳变的时间点往往和 PMF 跑通有关系,跑通后,整个人的思考水平、决策的犀利程度、心态的平稳度都有一个质变,再之后,就和业务量爬到几层楼相关了,月收入 1000 万、月收入 1 亿、月收入 10 亿是完全不同的思考水平,爬楼的中间,会有很多正负反馈,往往深刻又惨痛,反馈越大,能力跳变越明显。这才有了士别三日当刮目相看的感觉。

这让我明白了一个朴素的道理,产品是创始人的实验室,首先要跑通 PMF,让自己有个实验室,哪怕这个实验室小了点

然后要寻找更大的实验室,基于 10 万日活和 1 亿日活能做的实验是不一样的,一个人天天基于几亿日活做商业实验,他的水平能不高吗?为什么一些平台级产品的大佬思考水平极高,像开了天眼一样,因为他有几个亿的用户啊。

人人都想做有终局的产品,做下一个微信和抖音,但别忘了,张小龙是做 Foxmail 被腾讯收购的,Foxmail 是个邮件客户端,是那个年代最知名的套壳应用了。

基于这一观察,和 AI 现在所处的极早期阶段,在寻找 PMF 的时候,先不要嫌弃它是汤姆猫,找个具体且收敛的切入点,跑通它,让自己有个实验室,先完成能力跳变。

AI 和移动互联网的差异,远大于移动互联网和互联网的差异,先跳下来,刷一遍自己的 ROM 很重要。在 AI 这个全新的世界中,大多数人是从头学,今年完成能力跳变,还是明年完成能力跳变,会遇到截然不同的机遇。

但即便以汤姆猫的标准看 AI 应用,只求爆款,不苛求留存率,也只有前千分之一的产品能成汤姆猫。

03

超越汤姆猫,

才有机会成为 Super App

前千分之一的选手成为汤姆猫后,会面临两个选择:

一是基于汤姆猫继续绣花,迭代产品,希望做出长期留存,这很难,因为这个产品的地基很薄,就是绣花绣上天,也是个绣花版汤姆猫,基于汤姆猫建成一个迪斯尼娱乐王国是不现实的

二是通过做汤姆猫实现了团队能力升级,走出汤姆猫,去做新的事情。人站在一层楼和一百层楼看到的机会是不一样的,做过十亿的业务,自然会发现百亿业务的机会,这或许会找到更厚的地基,做出 super App。这是所谓的「超越汤姆猫」。

选一还是选二,是一道分水岭。很多耳熟能详的平台级产品,初创时都有过类似汤姆猫的阶段,又推出新产品超越了汤姆猫

2012 年 3 月,字节跳动成立,先推出的是内涵段子,同年 8 月推出了今日头条,2016 年 9 月,抖音上线。

2015 年 4 月,拼好货上线,做的是拼团买水果,同年 9 月,拼多多上线,切到了电商的主战场,2022 年 9 月,Temu 上线,开始海外的征程。

2010 年 3 月,美团团购上线,2013 年 11 月,美团外卖上线,2015 年 10 月,美团合并大众点评,从交易平台延伸到了信息平台。

好了,即便我们懂了「超越汤姆猫」这个道理,依然难过好这一生。

绝大多数情况下,人们很难大大方方承认自己是个汤姆猫,面对低留存率、低商业价值的时候,会做很多设想,是不是自己功能不够完善?是不是用户数量不够多?是不是应该把汤姆猫升级成社交产品,就有网络效应了?这种事情在移动互联网发生过很多了,做日历的、做滤镜的、做小游戏的,都有过平台梦。

「成为汤姆猫」是块石头,用好了可以踩着石头过河,实现「超越汤姆猫」;用不好是阻拦前行的巨石,做一辈子的汤姆猫。

04

Scaling Law 会成为 AI 时代的摩尔定律

上面是从质疑到成为的心路历程,也是感受当下,认清当下,抓住当下的过程。

那么更具体的聊聊当下,现在处于什么 timing,会推演出哪些信号?

最关键的信号,Scaling Law 会成为AI时代的摩尔定律,模型的智能程度每年增长百分之 X,价格降为之前的 1/N,现在还只有一个定性的描述,当 X 和 N 都成为一个定量数字的时候,这个规律就开始正式运转了。

Scaling Law 会把模型送上一个个新高度,从而会依次解锁上层应用,也就是造人。这些虚拟人需要替代真人,端到端的完成任务,做到「L4 级别」。在真实工作环境中,我们 90% 的时间是在解决那 10% 的难题,大模型能否解决好那 10% 的难题是一道及格线,过不了这个及格线,大模型只能做副驾 copilot,充其量是一个好用的软件;过了这个及格线,大模型就是主驾,我们开始为主驾付工资。

基于造人的标准,需要有一套图灵测试 2.0。在 ChatGPT 出来后,模型已经通过图灵测试 1.0,接近人的回答水平,以假乱真了。图灵测试 2.0 是一套基于工种的测试,比如文案策划、剧本杀小姐姐、程序员、医生,如果这个虚拟程序员能听懂你的需求、写出完整代码、修正 bug,那他就通过程序员图灵测试了。当下的大模型基本通过剧本杀小姐姐的图灵测试了,大家在 Character.ai、星野这些应用上和 AI 聊的很欢。

如果以图灵测试 2.0 来衡量当下的 AI Agent,真正的 Agent 尚未出现,真正意义上的 Agent 是可以自己规划任务,端到端的完成任务的。

如果第一个 Agent 出现,大概率是出在 OpenAI,因为他有最领先的模型,Agent 的出现主要和模型的智能程度相关,OpenAI 什么时候出 Agent 的 demo 产品,会是应用层百花齐放的关键信号

基于上面的这些推演,AI 还在很早期的阶段,如果硬要类比互联网的话,此时此刻对应 Yahoo 出现的门户时代。

做 AI 应用的创业者经常半夜问自己,我这应用有网络效应吗?放心,没有。

即便是 ChatGPT 也没有网络效应,只有品牌效应。互联网早期,门户网站也没有网络效应,只有品牌效应,Google 出来后才有了规模效应,Facebook 出来后才有了网络效应。

AI 行业什么时候会有网络效应这种城河?可能是 AI Agent 横行天下的时候,比如我们有个秘书 Agent,帮我们和生意上的伙伴约时间排会,双方的 Agent 一通交流,一握手,约好了!对方的 Agent 也必须是同一厂牌的 Agent,才能最大限度的交流,这就是 AI 时代的网络效应。

多久会发展到这个阶段?很难量化,但不要小看 AI 的进化速度。Sora 出来后,带给我最大的触动是,他比想象中来的快,行业里的人认为 2024 年年底或 2025 年才会出高质量的视频模型,OpenAI 直接在今年 2 月就拿出来了。

对 Sora 的热议,又一次体现了我们总是「高估当下,低估未来」,Sora 还没有公测,大家看到的是精选出来的 demo,在公测后,我估计大概率达不到大家的预期,这时又会出现「不过尔尔」的声音。又过一段时间,Sora 又进化的让人惊讶。

这种冷热交替,去年年初的时候已经在 ChatGPT 上上演过了,先是热议,认为要革命了,然后大家用了一段时间后,觉得还是有局限性,智慧程度不够,上层的杀手级应用也没出现,热议之后是冷静。然后 Sora 横空出世,又带来一波热议,如此往复。

别忘了,不管冷热,Scaling Law 永远在那里,在推动着模型成长。

万物自有其规律,没人能越过 1 到 17 岁,一步到位长到 18 岁。我们都知道 AI 带来的机会大,这是共识了。对当下 timing 的研判、对模型能力边界的理解,还处于非共识,这是真正考验创业者的地方

人人都想做有终局的产品,望着终局,恨不能省略中间的过程,跳跃中间的历史,直接做最有价值的事情,这是一种我执,忽略了真实世界运转的规律。

而理解汤姆猫、成为汤姆猫、超越汤姆猫,才是真实世界运转的规律,这是一种去执。

去执后,更容易看清当下,抓住当下。浪潮来的时候,关键是要站在海里,且早早学会游泳,早早习惯海水的味道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/522758.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React 事件机制原理

相关问题 React 合成事件与原生 DOM 事件的区别React 如何注册和触发事件React 事件如何解决浏览器兼容问题 回答关键点 React 的事件处理机制可以分为两个阶段:初始化渲染时在 root 节点上注册原生事件;原生事件触发时模拟捕获、目标和冒泡阶段派发合…

c++的STL(2)-- vector容器

目录 1. 默认构造 代码: 相关知识点: 2. 有参构造函数 以及 使用{}初始化对象 代码: 相关知识点: 3. vector容器在尾部添加和删除元素 代码: 使用push_back()和pop_back()进行尾部元素的添加和删除 相关知识点: 代码: 使用emplace_back在尾部添…

Unity插件之天气系统UniStorm

首先呢,它是一款强大的动态昼夜天气系统,能够以较快的帧速率创建AAA级动态生成的天气、照明和天空,并且具有300多个可定制的组件,允许用户创建任何可以想象的环境。 第一步:他需要两个物体Camera摄像机、Player播放器…

knife4j生产环境禁止打开页面

Knife4j是一个集Swagger2 和 OpenAPI3为一体的增强解决方案,官网地址:Knife4j 集Swagger2及OpenAPI3为一体的增强解决方案. | Knife4j 考虑到安全性问题,在实际服务部署到生产环境后就需要禁用到swagger页面的展示,这个时候只需…

报错:ModuleNotFoundError: No module named ‘tensorrt’

写在前面 我安装了tensorRT,在运行它自带的模型都没问题。 但是在代码中import tensorrt就报错: ModuleNotFoundError: No module named ‘tensorrt’。 网上搜了一大堆,发现是没有在自己的python环境下安装。 所以特意写这篇文章记录一下。 在进行下一…

继深圳后,重庆与鸿蒙展开原生应用开发合作

截至2023年底,开源鸿蒙开源社区已有250多家生态伙伴加入,开源鸿蒙项目捐赠人达35家,通过开源鸿蒙兼容性测评的伙伴达173个,累计落地230余款商用设备,涵盖金融、教育、智能家居、交通、数字政府、工业、医疗等各领域。 …

C++之创建与使用dll

目录 1、创建dll test.h test.cpp Source.def 2、使用dll testdll.cpp DLL,全称“Dynamic Link Library”,中文名为“动态链接库”,是一种在Windows操作系统中常见的库文件格式。它包含了可以由多个程序同时使用的代码和数据。与静态链接…

Docker安装主从数据库

我自己的主数据库名字 user_muster 密码是123456 从数据库 就是slave2 名字是root 密码是123456 首先开启docker后直接执行命令 docker run -d \ -p 3307:3306 \ -v /xk857/mysql/master/conf:/etc/mysql/conf.d \ -v /xk857/mysql/master/data:/var/lib/mysql \ -e MYSQL_…

瑞芯微 | I2S-音频基础 -1

最近调试音频驱动,顺便整理学习了一下i2s、alsa相关知识,整理成了几篇文章,后续会陆续更新。 喜欢嵌入式、Li怒晓得老铁可以关注一口君账号。 1. 音频常用术语 名称含义ADC(Analog to Digit Conversion)模拟信号转换…

OpenCASCADE+Qt创建建模平台

1、建模平台效果 2、三维控件OCCWidget 将V3d_View视图与控件句柄绑定即可实现3d视图嵌入Qt中&#xff0c;为了方便也可以基于QOpenGLWidget控件进行封装&#xff0c;方便嵌入各种窗体使用并自由缩放。 #ifndef OCCTWIDGET_H #define OCCTWIDGET_H#include <QWidget> #i…

FFmpeg教程(干货快速上手)

什么是FFmpeg&#xff1f; FFmpeg是一款免费、开源的跨平台多媒体处理工具&#xff0c;它支持几乎所有的视频格式和编码标准。FFmpeg包含了一系列的子项目和工具&#xff0c;如ffmpeg命令行工具用于转码和处理视频和音频文件&#xff0c;ffplay用于播放多媒体内容&#xff0c;…

Python学习笔记 -- 基础语法篇

目录 一. 数据类型 二. 注释 三. 输入输出及强制类型转换 3.1 print和input 3.2 强制类型转换 四. 运算符 4.1 算数运算符 4.2 比较运算符 4.3 逻辑运算符 五. 多元赋值 六. 条件语句 七. 循环语句 7.1 while循环 7.2 for循环 7.3 continue和break 一. 数据类型 …