写下这个标题时,我心情非常复杂,理想汽车在 2023 年前,给大众的印象几乎是冰箱彩电大沙发,智能化宣传着墨极少。
在小鹏公开宣布将自动驾驶作为自己的核心能力,蔚来也大举投入智能化研发时,理想汽车用极强的产品定义能力,满足了目标客户的产品需求,并且找到了非常大的拥趸群体。
虽然彼时从用户端理想的智能化能力也收到了不错的评价,但是相比其他两家的攻势,理想汽车的声量显然不足。
直到在 2023 年初,事情才发生变化,理想汽车创始人李想在 2023 年开年内部信中提出,公司的愿景是在 2030 年成为:「全球领先的人工智能企业」。
这宣布李想正式大举进军智能化领域,并且试图将智能化作为产品的核心价值。
同年四月,李想在一次媒体沟通会上表示,理想汽车有 4 支人工智能算法团队,智能座舱 AI 团队、智能驾驶团队、智能工厂团队、智能零售团队。
在 2023 年 6 月,理想汽车突然开启城市 NOA 媒体试驾,时间节点领先大部分智能驾驶团队,大大超出了外部团队的意料,理想汽车智能驾驶真正开始抓住观众的注意力。
在 2023 年 10 月,李想在自身的回忆总结中反思,智能驾驶的投入时机晚了半年。
当时我看到这篇新闻稿,隐隐觉得晚了半年的描述似乎是非常保守的,毕竟蔚来汽车 2020 年底就已经将任少卿招募麾下,大力组建团队;当时小鹏汽车的智能驾驶团队更是星光熠熠,谷俊丽、曹光植、吴新宙等等,都是业内知名技术大牛。
而理想汽车的智能化团队虽然一直有投入,但是从 2022 年中,才大举扩张。
不可否认的一点是,这个时间点相较于头部团队是相对靠后的。
但是新势力账面上最多的现金储备让理想汽车智能化团队的扩张有了充分的底气,例如 2023 年的校招 Offer 理想几乎给出了智能驾驶行业最高的价格,远高于蔚来和小鹏。
一年过去了,为了追赶进度,这一年,理想自动驾驶团队多次传出高强度封闭开发(封闭开发:软件行业高强度日程工作说法,模糊上下班概念)的消息。
在 2024 年 1 月,OTA 5.0 交卷, 理想汽车的大幅产品力提升。
尤其是理想 OTA 5.0 发布之后,某直接竞品智能驾驶工程师向我表示:「大大超出我们的预料,回去睡不着觉。」
这似乎证明李想再一次判断正确,不论是对整体行业技术演进趋势或者是内部研发节奏。
智能化技术护城河为什么如此轻易可以被跨过?作为后来者的理想汽车,做对了什么?
我想从智能驾驶和大模型两部分来谈,这也是这次理想汽车重点推送的两部分技术。
01
撕破智驾的护城河
众所周知,智能驾驶所需的投入非常大。
按照公开信息,蔚来、小鹏智能驾驶团队分别在 1000 人左右的规模,并且这个规模已经维持了较长时间。
理想汽车 OTA 5.0 之后,几乎有追平的势头。
为何?
我们仔细看目前的智能驾驶硬件方案会发现,几乎每一家都遵循着相似的硬件配置,多个遍布周身的摄像头用来做行车,可以完成 BEV 方案做好感知:一个前视 Lidar 将前方的距离探测做的更加精准,两个 Orin 芯片来保证基础的算力充足。
但是实际上,这并不是最早的智能驾驶方案,在 2021 年底,实际上整个行业的智能驾驶技术栈发生了一次巨大的变革。
在 2021 年 Tesla AI Day 上,特斯拉证明了 BEV 方案可行。
鸟瞰图方案将所有摄像头的信息融合在一起,解决了难以处理的遮挡问题,并且获得了更好的地图拓扑绘制基础。
众多厂商纷纷跟进,上一代以 Mobileye 为首的前视觉为主的摄像头方案已经基本上被抛弃,而类似的方案就出现在蔚来和小鹏的一代平台上。
新的感知方案、新的规划控制输入、新的硬件,割裂的 L2 功能被整合成高阶的城市辅助驾驶。
这意味着,之前的投入几乎化为乌有。
数据被重新收集、算法被重写、软件重新集成,留下的可能只是模糊的对 L2 功能的经验,需要用更高阶的思考重新开发。
幸运的是,或者说是极其精准的判断,理想汽车对智能驾驶技术的投入,刚好是这个时间点。
而理想汽车的开发过程也是在用更高阶的思考去重新定义 L2 功能。
为什么这么说?
我们可以从这次发布中一窥端倪。
城市 LCC Plus
对,就是那个引发争论的全球都能开。
初看到这个功能,还占据了不小的篇幅,我心里想基础的 L2 功能车道保持有什么好发布的?
但是直到我看到里面包括红绿灯启停和舒适避障,我才理解这句话的来源。
LCC 的全称是车道居中辅助,顾名思义车辆找到车道之后车辆主动保持在车道内。
红绿灯启停和舒适避障这些其实都不包括在原有 L2 产品定义里,但是理想汽车在一个精妙的时间点重新开发了这个功能。
红绿灯启停
这件事难吗?
从以早期 L2 方案原理来说并不难,红绿灯识别,纵向控制,不管从感知还是控制层面,都不能说是一件复杂的事情。
对于计算机视觉的工程师来说,这几乎是一个入门级任务。
例如下面的代码,一个大一的计算机学生半天可能就能跑起来。
https://github.com/nileshchopda/Traffic-Light-Detection-And-Color-Recognition/tree/master
但是面对全国众多的红绿灯样式,不同天气对红绿灯亮度的影响,红绿灯和车道之间的对应关系,大路口没有车道线的情况,一个简单的问题都逐渐演化成复杂的问题,上一代方案几乎没有车企宣布上线。
因为这里的简单是原理层面上的,而工程实现层面上却具有相当大的难度。
在新的硬件平台和软件架构上,理想汽车进阶开发了端到端红绿灯识别算法,将规则化识别变为数据驱动,换了一种方式去解决,是非常值得称道的创新。
舒适避障
LCC 具有一定的横向控制能力,获得车道线之后按照车道线行驶,但是按照最初的功能定义并不包括避障。
该功能由 Mobileye 首次提供,当时 Mobileye 还和特斯拉如胶似漆,硬件上使用一个摄像头和一个雷达就能完成功能,并且是在高速上才能提供,车道线相对简单,路况也好。
实际上这种简单的车道线识别也是非常容易实现的功能,最早按照最基础的传统计算机视觉算法进行模式匹配即可完成。
例如典型的边缘检测:
但是现在,从传统的机器视觉到以神经网络为基础的车道线识别,对周围环境的描述能力也发生了巨大的变化。
但是理想汽车重新思考定义后,将自己进阶功能的避障下发到了 LCC,在通往城市导航辅助驾驶的路上,这是低垂的果实,但是却能够实在给用户提供新的价值。
讲完行车,我们会发现,这些功能如果只是给一个模糊的概念,我们会觉得并无新意,但是仔细了解之后会发现其实理想汽车用更高阶的思考重新定义了这些 L2 功能,这是在技术变革时刻对功能的创新开发。
同样的,在泊车部分,也着相似的故事。
泊车
是的,理想的 demo 真的落地了。
回想起 2023 年底的代客泊车 demo 大战,智界打响第一枪,理想随后跟上,蔚来也发布自己的自主泊车换电。
与前文一样,代客泊车并不是非常难做出 demo 的功能,早年 L2 技术栈几乎公开化。
本地特征建图加上实时障碍物识别就能做出来不错的 demo,这个技术细节可能是每个学人工智能硕士阶段的必修课程。
例如下面的 B 站实现:
不过世界上的停车场千奇百怪,也不会有一模一样的停车场,如何保证足够多的停车场有比较好的用户体验,这是难度非常大的。
在新的平台上,因为有了更好的摄像头和激光雷达,能够对停车场的地图进行更好的建模。
更加充足的算力也能在实时运行的过程中为轨迹规划提供更多搜索的空间。
所以理想汽车交出了一份与之前 L2 泊车辅助完全不一样的答卷。
支持的功能也非常强大,支持多层跨层泊车,并且使⽤地点⽆限制,坡道、平地、盘旋通道随时可⽤,⾏驶路线灵活,障碍物阻挡前进时可倒⻋,这与上一代 L2 的技术方案已经有了显著的区别。
从以上看,理想汽车用极强的组织效率,用精准的战略时间判断,用最短的时间和团队对功能的重新定义与思考,几乎追平了头部团队的智能驾驶水平。
其实也不难理解,上一代的方案已经基本上被抛弃,面对新方案的切换,理想汽车的投入时间并没有落后。
那么大模型领域呢?
02
大模型的战场才刚刚开始
Mind GPT 版理想同学
记得那天理想汽车发布 Mind GPT,并宣布 C-Eval 中文大模型综合性测评榜冠军。
我困意正浓,却被这个消息惊讶得马上坐起来并且马上开始查所有的公开消息,试图证明一个短时间组建出来的团队,不会有什么真正的成绩。
事实证明,我的想法是错的。
因为大模型领域,国内几乎没有长期投入的团队,资金也是 2023 年初才开始进入。
如果说智能驾驶领域理想汽车是遵循已经公开的技术栈,大模型领域理想甚至可以说站在了先锋队里。
不过很遗憾,在这个领域,也只有短暂的领先,vivo 和荣耀的大模型目前也以微弱的优势取代了 Mind GPT 的位置。
但是大模型结合车内座舱的提供和产品定义,理想汽车再次走在了第一位。
一句话的出行灵感,车内的 AI 绘画大师,还有符合理想目标客群的儿童百科全书功能都值得肯定。
大模型是底座,在上面生长出来的应用才会拥有真正的生命力。
于此同时,大模型很有可能作为自动驾驶的大脑,集成进自动驾驶,这是目前沿团队都在努力发展的方向。
图森未来中国首席科学家,著名自动驾驶专家王乃岩在知乎发表过一篇文章 GPT-4V 在自动驾驶中初探,他表示:
非常 exciting,个人认为合理使用这样的大模型可以大大加快 L4 乃至 L5 自动驾驶的发展。
而目前大模型应用到自动驾驶的研究方向炙手可热,根据上海人工智能实验室近期发布的综述文章:
多模态的数据作为模型底座,让模型拥有足够的推理和泛化能力,相当于拥有一个大脑,接下来让整个大脑学习开车,具有非常令人期待的潜力。
从这个角度看,如果说之前是公开的算法,理想跟上了目前的第一梯队,或许理想汽车的自研大模型很有可能会让理想汽车真正在自动驾驶领域实现弯道超车。 [图片]
写在最后
提到理想汽车,公众会想到什么?
冰箱彩电大沙发带来的无敌的产品力,但是似乎技术是天然的短板。
但是从这次 OTA 5.0 版本的软件看,理想汽车在判断合适的时间进入之后,已经默默在技术领域耕耘了很久,并且给出了一份不容小觑的答卷。
技术的突破,不仅靠个体的创新,也要靠一个团队优秀的组织效率。
OpenAI 就是如此,组织的高效带来了技术的持续领先。
而理想汽车的组织效率,被车企广为赞扬。
我很喜欢的一本书《浪潮之巅》,里面用演义的方式描述了硅谷波诡云谲的科技公司斗争。
里面我非常喜欢的观点是:抓住科技革新的机遇可以让一家公司成为一个领域的霸主。
例如 IBM 抓住了电子计算机发展的浪潮,从一家机械制造公司,崛起为计算机领域的超级巨头,但是科技公司的竞争异常残酷,技术并不是唯一的决胜因素,有些公司创立之初,面对激烈竞争,自己并没有特别的技术优势。
例如微软,但是选择了正确的道路,之后逐步积累起了行业护城河,逐步成长为巨无霸。
如果说 5.0 理想汽车开了一个不错的头,并且在某些方面获得了一定的领先。
那么接下来通往人工智能公司这条路依然泥泞满地,我们祝福理想:道阻且长,祝你后发先至。