​理想汽车:智能化之路,道阻且长后发先至

‍‍‍688a3ffbc6db8795aa504999be96f7c8.jpeg

写下这个标题时,我心情非常复杂,理想汽车在 2023 年前,给大众的印象几乎是冰箱彩电大沙发,智能化宣传着墨极少。

在小鹏公开宣布将自动驾驶作为自己的核心能力,蔚来也大举投入智能化研发时,理想汽车用极强的产品定义能力,满足了目标客户的产品需求,并且找到了非常大的拥趸群体。

虽然彼时从用户端理想的智能化能力也收到了不错的评价,但是相比其他两家的攻势,理想汽车的声量显然不足。

直到在 2023 年初,事情才发生变化,理想汽车创始人李想在 2023 年开年内部信中提出,公司的愿景是在 2030 年成为:「全球领先的人工智能企业」

这宣布李想正式大举进军智能化领域,并且试图将智能化作为产品的核心价值。

同年四月,李想在一次媒体沟通会上表示,理想汽车有 4 支人工智能算法团队,智能座舱 AI 团队、智能驾驶团队、智能工厂团队、智能零售团队。

在 2023 年 6 月,理想汽车突然开启城市 NOA 媒体试驾,时间节点领先大部分智能驾驶团队,大大超出了外部团队的意料,理想汽车智能驾驶真正开始抓住观众的注意力。

在 2023 年 10 月,李想在自身的回忆总结中反思,智能驾驶的投入时机晚了半年。

当时我看到这篇新闻稿,隐隐觉得晚了半年的描述似乎是非常保守的,毕竟蔚来汽车 2020 年底就已经将任少卿招募麾下,大力组建团队;当时小鹏汽车的智能驾驶团队更是星光熠熠,谷俊丽、曹光植、吴新宙等等,都是业内知名技术大牛。

而理想汽车的智能化团队虽然一直有投入,但是从 2022 年中,才大举扩张。

不可否认的一点是,这个时间点相较于头部团队是相对靠后的。

但是新势力账面上最多的现金储备让理想汽车智能化团队的扩张有了充分的底气,例如 2023 年的校招 Offer 理想几乎给出了智能驾驶行业最高的价格,远高于蔚来和小鹏。

96ec67fa7455c7314efcc0fd15acc3e7.jpeg

一年过去了,为了追赶进度,这一年,理想自动驾驶团队多次传出高强度封闭开发(封闭开发:软件行业高强度日程工作说法,模糊上下班概念)的消息。

在 2024 年 1 月,OTA 5.0 交卷, 理想汽车的大幅产品力提升。

尤其是理想 OTA 5.0 发布之后,某直接竞品智能驾驶工程师向我表示:「大大超出我们的预料,回去睡不着觉。」

这似乎证明李想再一次判断正确,不论是对整体行业技术演进趋势或者是内部研发节奏。

智能化技术护城河为什么如此轻易可以被跨过?作为后来者的理想汽车,做对了什么?

我想从智能驾驶和大模型两部分来谈,这也是这次理想汽车重点推送的两部分技术。

01

撕破智驾的护城河

众所周知,智能驾驶所需的投入非常大。

按照公开信息,蔚来、小鹏智能驾驶团队分别在 1000 人左右的规模,并且这个规模已经维持了较长时间。

理想汽车 OTA 5.0 之后,几乎有追平的势头。

为何?

我们仔细看目前的智能驾驶硬件方案会发现,几乎每一家都遵循着相似的硬件配置,多个遍布周身的摄像头用来做行车,可以完成 BEV 方案做好感知:一个前视 Lidar 将前方的距离探测做的更加精准,两个 Orin 芯片来保证基础的算力充足。

bb43506abd718b69aec95d5b2d57f30f.jpeg

但是实际上,这并不是最早的智能驾驶方案,在 2021 年底,实际上整个行业的智能驾驶技术栈发生了一次巨大的变革。

在 2021 年 Tesla AI Day 上,特斯拉证明了 BEV 方案可行。

鸟瞰图方案将所有摄像头的信息融合在一起,解决了难以处理的遮挡问题,并且获得了更好的地图拓扑绘制基础。

众多厂商纷纷跟进,上一代以 Mobileye 为首的前视觉为主的摄像头方案已经基本上被抛弃,而类似的方案就出现在蔚来和小鹏的一代平台上。

新的感知方案、新的规划控制输入、新的硬件,割裂的 L2 功能被整合成高阶的城市辅助驾驶。

这意味着,之前的投入几乎化为乌有。

数据被重新收集、算法被重写、软件重新集成,留下的可能只是模糊的对 L2 功能的经验,需要用更高阶的思考重新开发。

幸运的是,或者说是极其精准的判断,理想汽车对智能驾驶技术的投入,刚好是这个时间点。

而理想汽车的开发过程也是在用更高阶的思考去重新定义 L2 功能。

为什么这么说?

我们可以从这次发布中一窥端倪。

城市 LCC Plus

对,就是那个引发争论的全球都能开。

初看到这个功能,还占据了不小的篇幅,我心里想基础的 L2 功能车道保持有什么好发布的?

但是直到我看到里面包括红绿灯启停和舒适避障,我才理解这句话的来源。

LCC 的全称是车道居中辅助,顾名思义车辆找到车道之后车辆主动保持在车道内。

红绿灯启停和舒适避障这些其实都不包括在原有 L2 产品定义里,但是理想汽车在一个精妙的时间点重新开发了这个功能。

红绿灯启停

6a7e943bc159014d59032ae3fb2f8b3c.jpeg

这件事难吗?

从以早期 L2 方案原理来说并不难,红绿灯识别,纵向控制,不管从感知还是控制层面,都不能说是一件复杂的事情。

对于计算机视觉的工程师来说,这几乎是一个入门级任务。

例如下面的代码,一个大一的计算机学生半天可能就能跑起来。

https://github.com/nileshchopda/Traffic-Light-Detection-And-Color-Recognition/tree/master

65f749b9da96c226b441332afc7bdd39.jpeg

但是面对全国众多的红绿灯样式,不同天气对红绿灯亮度的影响,红绿灯和车道之间的对应关系,大路口没有车道线的情况,一个简单的问题都逐渐演化成复杂的问题,上一代方案几乎没有车企宣布上线。

因为这里的简单是原理层面上的,而工程实现层面上却具有相当大的难度。

在新的硬件平台和软件架构上,理想汽车进阶开发了端到端红绿灯识别算法,将规则化识别变为数据驱动,换了一种方式去解决,是非常值得称道的创新。

舒适避障

LCC 具有一定的横向控制能力,获得车道线之后按照车道线行驶,但是按照最初的功能定义并不包括避障。

该功能由 Mobileye 首次提供,当时 Mobileye 还和特斯拉如胶似漆,硬件上使用一个摄像头和一个雷达就能完成功能,并且是在高速上才能提供,车道线相对简单,路况也好。

实际上这种简单的车道线识别也是非常容易实现的功能,最早按照最基础的传统计算机视觉算法进行模式匹配即可完成。

例如典型的边缘检测:

477822afb0e50d451034cceff88743b6.jpeg

但是现在,从传统的机器视觉到以神经网络为基础的车道线识别,对周围环境的描述能力也发生了巨大的变化。

88176f2a346b93ebc5ec93db23dfddaf.jpeg

但是理想汽车重新思考定义后,将自己进阶功能的避障下发到了 LCC,在通往城市导航辅助驾驶的路上,这是低垂的果实,但是却能够实在给用户提供新的价值。

讲完行车,我们会发现,这些功能如果只是给一个模糊的概念,我们会觉得并无新意,但是仔细了解之后会发现其实理想汽车用更高阶的思考重新定义了这些 L2 功能,这是在技术变革时刻对功能的创新开发。

同样的,在泊车部分,也着相似的故事。

泊车

是的,理想的 demo 真的落地了。

回想起 2023 年底的代客泊车 demo 大战,智界打响第一枪,理想随后跟上,蔚来也发布自己的自主泊车换电。

与前文一样,代客泊车并不是非常难做出 demo 的功能,早年 L2 技术栈几乎公开化。

本地特征建图加上实时障碍物识别就能做出来不错的 demo,这个技术细节可能是每个学人工智能硕士阶段的必修课程。

例如下面的 B 站实现:

f7a8e8bbeeb51f3caa3e015de1a165dd.jpeg

不过世界上的停车场千奇百怪,也不会有一模一样的停车场,如何保证足够多的停车场有比较好的用户体验,这是难度非常大的。

在新的平台上,因为有了更好的摄像头和激光雷达,能够对停车场的地图进行更好的建模。

更加充足的算力也能在实时运行的过程中为轨迹规划提供更多搜索的空间。

所以理想汽车交出了一份与之前 L2 泊车辅助完全不一样的答卷。

支持的功能也非常强大,支持多层跨层泊车,并且使⽤地点⽆限制,坡道、平地、盘旋通道随时可⽤,⾏驶路线灵活,障碍物阻挡前进时可倒⻋,这与上一代 L2 的技术方案已经有了显著的区别。

从以上看,理想汽车用极强的组织效率,用精准的战略时间判断,用最短的时间和团队对功能的重新定义与思考,几乎追平了头部团队的智能驾驶水平。

其实也不难理解,上一代的方案已经基本上被抛弃,面对新方案的切换,理想汽车的投入时间并没有落后。

那么大模型领域呢?

02

大模型的战场才刚刚开始

Mind GPT 版理想同学

记得那天理想汽车发布 Mind GPT,并宣布 C-Eval 中文大模型综合性测评榜冠军。

我困意正浓,却被这个消息惊讶得马上坐起来并且马上开始查所有的公开消息,试图证明一个短时间组建出来的团队,不会有什么真正的成绩。

事实证明,我的想法是错的。

因为大模型领域,国内几乎没有长期投入的团队,资金也是 2023 年初才开始进入。

如果说智能驾驶领域理想汽车是遵循已经公开的技术栈,大模型领域理想甚至可以说站在了先锋队里。

不过很遗憾,在这个领域,也只有短暂的领先,vivo 和荣耀的大模型目前也以微弱的优势取代了 Mind GPT 的位置。

cdf2bc4389d8e5f9438ee9450d893c2b.jpeg

但是大模型结合车内座舱的提供和产品定义,理想汽车再次走在了第一位。

一句话的出行灵感,车内的 AI 绘画大师,还有符合理想目标客群的儿童百科全书功能都值得肯定。

大模型是底座,在上面生长出来的应用才会拥有真正的生命力。

于此同时,大模型很有可能作为自动驾驶的大脑,集成进自动驾驶,这是目前沿团队都在努力发展的方向。

图森未来中国首席科学家,著名自动驾驶专家王乃岩在知乎发表过一篇文章 GPT-4V 在自动驾驶中初探,他表示:

非常 exciting,个人认为合理使用这样的大模型可以大大加快 L4 乃至 L5 自动驾驶的发展。

而目前大模型应用到自动驾驶的研究方向炙手可热,根据上海人工智能实验室近期发布的综述文章:

多模态的数据作为模型底座,让模型拥有足够的推理和泛化能力,相当于拥有一个大脑,接下来让整个大脑学习开车,具有非常令人期待的潜力。

从这个角度看,如果说之前是公开的算法,理想跟上了目前的第一梯队,或许理想汽车的自研大模型很有可能会让理想汽车真正在自动驾驶领域实现弯道超车。 [图片]

写在最后

提到理想汽车,公众会想到什么?

冰箱彩电大沙发带来的无敌的产品力,但是似乎技术是天然的短板。

但是从这次 OTA 5.0 版本的软件看,理想汽车在判断合适的时间进入之后,已经默默在技术领域耕耘了很久,并且给出了一份不容小觑的答卷。

技术的突破,不仅靠个体的创新,也要靠一个团队优秀的组织效率。

OpenAI 就是如此,组织的高效带来了技术的持续领先。

而理想汽车的组织效率,被车企广为赞扬。

我很喜欢的一本书《浪潮之巅》,里面用演义的方式描述了硅谷波诡云谲的科技公司斗争。

里面我非常喜欢的观点是:抓住科技革新的机遇可以让一家公司成为一个领域的霸主

例如 IBM 抓住了电子计算机发展的浪潮,从一家机械制造公司,崛起为计算机领域的超级巨头,但是科技公司的竞争异常残酷,技术并不是唯一的决胜因素,有些公司创立之初,面对激烈竞争,自己并没有特别的技术优势。

例如微软,但是选择了正确的道路,之后逐步积累起了行业护城河,逐步成长为巨无霸。

如果说 5.0 理想汽车开了一个不错的头,并且在某些方面获得了一定的领先。

那么接下来通往人工智能公司这条路依然泥泞满地,我们祝福理想:道阻且长,祝你后发先至。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/589357.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里云数据库服务器价格表,2024年最新报价

阿里云数据库服务器价格表,优惠99元一年起,ECS云服务器2核2G、3M固定带宽、40G ESSD Entry云盘,优惠价格99元一年;阿里云数据库MySQL版2核2G基础系列经济版99元1年、2核4GB 227.99元1年,云数据库PostgreSQL、SQL Serve…

Cesium 仿高德导航线

最近在开发无人机平台中,做一个自主航线规划时,为了达到一个好的航线展示效果,决定仿照高德地图中的线路导航来做。高德地图导航线效果如下: 开始的时候想通过传统的贴图方式来进行处理,发现使用此种方式时&#xff0c…

深入C语言:探究static关键字的奥秘

文章目录 一、链接属性二、static变量1、定义静态局部变量2、在函数内部使用静态变量3、函数中静态局部变量与递归 三、static变量与全局变量的区别1、存储期与生命周期2、可见性与作用域3、使用场景4、静态与动态内存分配 注意事项 当用于不同的上下文环境时, sta…

手搓 Docker Image Creator(DIC)工具(02):预备知识

此节主要简单介绍一下 Docker、Dockerfile 的基本概念,Dockerfile 对的基本语法,Windows 和 macOS 下 Docker 桌面的安装,Docker 镜像的创建和运行测试等。 1 关于 Docker Docker 是一个开源的应用容器引擎,它允许开发者打包应用…

各种坐标系辨析

坐标系辨析 0. 地球椭圆体1. 大地坐标系2. eci地心惯性坐标系3. 地心地固坐标系(ECEF坐标系,E系)4. 站心坐标系(ENU坐标系)5. LTM坐标系6. IMU坐标系7. 代码部分7.1 LLA(大地坐标系坐标、经纬度海拔)坐标转LTM系(ENU系)下的三维笛卡尔坐标 0. 地球椭圆体 地球表面是…

游泳耳机哪个牌子最好?2024好评率爆表的四款游泳耳机推荐!

在当今快节奏的生活中,运动成为了我们保持健康和放松身心的重要方式之一。游泳作为一项全身运动,不仅可以帮助我们塑造身材,还能让我们在水中尽情享受自由的感觉。然而,在游泳过程中,音乐却往往因为防水问题而成为一种…

【氮化镓】同质GaN垂直PiN二极管的SEB

【Single-event burnout in homojunction GaN vertical PiN diodes with hybrid edge termination design. Appl. Phys. Lett. 124, 132101 (2024)https://doi.org/10.1063/5.0189744】 概括: 本研究探讨了具有混合边缘终止设计(Hybrid Edge Terminati…

LabVIEW挖坑指南

一、挖坑指南 1.1、输出变量放在条件框内 错误写法: 现象:如果没进入对应的分支,输出为默认值 正常写法: 让每个分支输出的值都在预料之内。 1.2、统计耗时不准 错误写法 现象:统计出来的耗时是2000ms 正常写法&a…

【Java代码审计】SSRF篇

【Java代码审计】SSRF篇 1.SSRF漏洞2.Java-SSRF漏洞常见接口3.SSRF漏洞演示URLConnectionURLConnection绕过 4.SSRF修复白名单方式过滤方式通用预防SSRF方法 1.SSRF漏洞 SSRF 是 Server-Side Request Forge 的英文首字母缩写,中文意思是服务器端请求伪造。Web 应用…

Coze工作流介绍(一)

Coze工作流介绍 工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能进行组合,从而实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。 当目标任务场景包含较多的步骤,且对输出结果的准确性、格式有严格要求时…

鱼哥赠书活动第17期:看完这本《Python数据分析》菜鸟也能做Python数据分析?

鱼哥赠书活动第17期:看完这本《Python数据分析》菜鸟也能做Python数据分析? 一、Python是办公自动化的重要工具二、Python是提升职场竞争力的利器三、Python是企业数字化的重要平台四、Python是AI发展的重要通道之一内容简介:第一部分(第1~7章…

c++|vector使用及模拟实现

目录 一、vector的介绍 二、vector的使用(常用接口) 2.1string类的成员函数 2.1.1构造函数 2.1.2析构函数 2.1.3“”运算符重载函数 2.2 迭代器(iterator) 及 对象的遍历访问 2.2.1iterator 2.2.2 operator[] && at() 2.2.4 back() && front() 2.2…