觉非科技李东旻:智能驾驶向大模型的进化与感知决策新范式的诞生

由亿欧汽车主办“AI与新一代车载智能感知融合创新论坛”近日登陆2023世界人工智能大会(WAIC)。觉非科技CEO李东旻受邀发表了“智能驾驶向大模型的进化与感知决策新范式的诞生”主题演讲,从产业趋势结合技术发展特点以及在感知决策中的能力应用等角度进行了系统化介绍。

觉非科技:自动驾驶量产时代的软件Tier1

李东旻首先就“软件定义汽车”背后的核心驱动力进行了阐释。首先,整个汽车的电子电气架构已经基本转向了大算力平台与中央软件平台结合的架构,这使得以软件为核心的解决方案得以“上车”。

 其次,国内主机厂正在不断增加对自动驾驶技术的投入,以确保响应快速的迭代周期,而这也为软件的发展带来了不断扩展的蓝海空间。

与此同时,AI模型将进一步影响汽车数字化程度,车辆软件功能与OTA将主要围绕数字化进行升级,且未来大部分升级将在软件层面进行,而不论是大模型还是小模型,都将使汽车越来越趋近于数字化产品,这种转变带来的化学反应和新产品形态,将在未来发展中具备巨大的潜力。

自动驾驶向大模型的进化

演讲中,李东旻介绍了自动驾驶发展的不同阶段。在第一阶段中,智能驾驶解决方案依靠的是各个小模型的堆叠,也就是通过多个独立“小模型”构成自动驾驶的感知、跟踪、融合、预测等能力,而这也是现阶段自动驾驶解决方案的主要输出方式。

觉非科技的融合定位能力、激光点云融合感知能力即是自动驾驶小模型的典型代表。

 “从2022年开始,觉非科技的融合定位产品就已经开始量产上车。”李东旻提到。觉非在自动驾驶车辆的定位上,融合了激光点云或者视觉感知信息、车身信号与高精度地图数据,通过适配层、算法支撑层与融合层,将多种车辆信息与环境信息进行实时数据融合计算,可应对各类道路复杂场景。

在这个阶段中,觉非科技业界首创完成了3D SPConv(稀疏卷积)在嵌入式平台的移植和优化,并完成了全息路口超大规模点云感知。感知范围可覆盖10万+平米超大场景,单帧可完成超过500个目标输出,不断提升着自动驾驶的安全性与鲁棒性。

在第一阶段中,觉非科技通过在算法、数据上的积累,为第二阶段,即“自动驾驶大模型与大数据方案”的到来,创造了先天的优势与壁垒。

而在大模型的部署上,难点在于算力与数据的支持。举例而言,大模型所需的数据量通常是小模型的100倍以上,以前如果用10万帧或100万帧的数据训练就可以达到量产标准,而现在大模型则需要至少10亿帧的数据作为起点。

“整个行业在自动驾驶技术路径上达成了惊人的共识,即都希望在自己的技术路径上使用Transformer大模型。因此无论是新势力还是传统主机厂,都在自研或与觉非这样的合作伙伴进行技术合作,开展大模型的研发与量产。”李东旻提到。

 通过在车端与路侧的大量技术实践,觉非积累了覆盖不同场景的自动驾驶数据集,并转化成了数据服务平台,为大模型的发展奠定了坚实的技术基础。

近期觉非也推出了BEV+Transformer算法量产架构。这套量产架构通过规模化数据采集,生成冷启动模型,而后通过量产化制图能力产生地图数据库,结合觉非自研的数据中心实现快速不断的迭代,供给生成BEV+Transformer的算法训练数据,进而实现大模型的正向循环。

在这套量产架构的支撑下,觉非同时推出了面向高速NOA的地图定位量产方案。方案通过车机导航地图或众源地图,结合量产车实时感知结果,可满足车辆在高速场景下的高精定位需求。

 

 

 

“大模型的出现将带动包含自动驾驶在内的整个科技生态链的变革:软件吞噬世界,平台吞噬软件,云吞噬平台。而这条科技食物链正迎来一位新的霸主,大模型正在吞噬云。很多玩家正在把精力放到大模型的应用上,也就是自动驾驶的各类衍生功能,而未来真正的核心玩家,则是奔着大模型的底层路线去探索,这个底层路线包含了大数据、算力布局、数据传输等等问题。”李东旻提到。

对于觉非科技而言,大模型将引发技术原生能力的不断提升,也就是以大模型为基础,开发自动驾驶相关能力与原生技术方案,这同时也让觉非拥有了颠覆与创新的新机会。而对于大模型成为产业应用与基座,还需要有场景深度融合的体系以及开放的生态来激发创新。觉非科技希望能够携手更多合作伙伴,共同推动正在发生着的产业技术变革。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/18281.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【安卓12源码】WMS的作用及其启动流程

一、WMS 的作用 WMS 在 Android 系统的地位,它作为中间层,连接了上层的 View 框架和下层的 SurfaceFingler。 WMS 主要职责 窗口管理:负责启动、添加、删除窗口,管理窗口大小、层级,核心成员有:WindowCont…

Java的Hibernate框架中集合类数据结构的映射编写教程

Java的Hibernate框架中集合类数据结构的映射编写教程 一、集合映射 1.集合小介 集合映射也是基本的映射,但在开发过程中不会经常用到,所以不需要深刻了解,只需要理解基本的使用方法即可,等在开发过程中遇到了这种问题时能够查询…

elementui自定义loading图标

效果图如下: 一、在assets下新建一个mycss.css文件夹(图片大小以及文字样式,可以根据自己的需求进行微调) .el-loading-spinner {/*这个是自己想设置的 gif 加载动图*/background-image: url(../gif2.gif); background-repeat: n…

redis的分布式事务-redisson

一 redisson 1.1 redisson分布式事务 Redisson分布式锁是一种基于redis实现的分布式锁,它利用redis的setnx命令实现分布式锁的互斥访问。同时还支持锁的自动续期功能,可以避免因为某个进程崩溃或者网络故障导致锁无法释放的情况。 只要线程一加锁成功…

各种好看的css效果收集

CSS动画特效-多种方案实现CSS光束扫过,扫光特效,ae文字过光效果,光效移动效果 一个集合180种免费的线性渐变网站,可在任何网站使用您不仅可以复制渐变的原生CSS颜色代码,还可以查看下载每个优质的渐变图片。 链接&…

第二课:Figma 界面认识

创建文件 进入 Figma 后,可以查看最近浏览的内容,官方也推荐了一些基础的项目,点击右上角 Design file(设计文件)即可创建项目; 注:网页版和本地版界面样式布局一致。 创建画布 点击左上画框…

C++_简单模拟实现string的基本结构

C中,string早于STL问世。使用string中的构造函数可以实现对string类型的字符串的一系列操作。 今天来模拟C中的string的基本结构。注意仅仅是简单模拟,string内部结构其实非常复杂,并且不同版本的IDEstring的内部结构也不尽相同。尽管有所不…

FLAC格式如何转换为MP3?分享三种方法!

在数字音乐的世界中,FLAC和MP3是两种常见的音频格式。FLAC (Free Lossless Audio Codec)提供无损的音质,但文件大小较大。而MP3文件较小,更易于传输和保存,但可能牺牲一些音质。如果你想将FLAC音频转换成MP3格式,本文将…

java版本企业电子招标采购系统源码Spring Cloud + Spring Boot +二次开发

java版本企业电子招标采购系统源码Spring Cloud Spring Boot 二次开发 一、立项管理 1、招标立项申请 功能点:招标类项目立项申请入口,用户可以保存为草稿,提交。 2、非招标立项申请 功能点:非招标立项申请入口、用户可以保存为草…

数学建模学习之简单设备分配问题

简单的设备分配问题 某公司新购置了某种设备 6台,欲分配给下属的4 个企业,已知各企业获得这种设备后年创利润如表 1.1 所示,单位为千万元。问应如何分配这些设备能使年创总利润最大,最大利润是多少? 表1.1的数据为: 对…

MYSQL学习第一天

1.创建数据库,删除数据库,查询创建数据的语句,使用数据库,查询当前默认的数据库以及使用的编码方式校验规则 1.1 创建数据库 create database db_name; 1.2 使用数据库 use db_name; 1.3 查询当前使用的数据库 select datab…

计讯物联网关型水利遥测终端机TY910确保闸站自动化监测长效运行

闸站是我国水利建设工程的重要组成部分,具备调度水源、防洪排涝、灌溉等能力,在农业、水路运输、养殖业等行业领域起着关键作用,进而解决区域水资源不均衡的问题,促进水资源多方面的利用。当前,我国闸站存在数量多、分…