智能汽车:自动驾驶浅谈(入门)

1、 自动驾驶——数据驱动下的算法迭代

1.1、 自动驾驶算法是感知、预测、规划、控制的结合体

自动驾驶算法反应了工程师们根据人的思维模式,对自动驾驶所需处理过程的思考。通常包含感知、预测、规划模块,同时辅助一些地图、定位等模块,实现自动驾驶功能的落地。
在这里插入图片描述

1.1.1、 感知:感知外部世界

感知模块主要解决四类任务:(1)检测:找出物体在环境中的位置;(2)分类:明确对象是什么,如分辨不同类别交通标志;(3)跟踪:随着时间的推移观察移动物体,通常采用跨帧追踪对象(将不同帧中检测到的对象进行匹配)、BEV 加入时序信息等实现;(4)语义分割:将图像中的每个像素与语义类别匹配,如道路、天空、汽车等,用于尽可能详细了解环境。
以 Apollo 感知算法框架为例,其算法包含预处理、神经网络模型、后处理等模块。首先图像预处理主要是对图像进行调整、畸变校正等,使之更符合机器学习的要求。其次分别对红绿灯、车道线、障碍物等特征进行检测,其中红绿灯通过检测边框、颜色等进行进一步的识别;障碍物则经过 2D 到 3D 的转换,得出真实的信息坐标,再融合车道线检测信息、外部传感器信息等得出真实世界的障碍物信息。该部分通常采用全卷积神经网络或者 YOLO 等算法实现。
在这里插入图片描述

1.1.2、 预测:理解外部环境和当前状态

预测模块实际上是算法对外部环境和自车状态的理解。预测模块首先收集感知模块输入的车道线、障碍物、红绿灯、地图、定位等信息对主车的状况进行判断。
其次场景感知模块对外部障碍物的优先级、路权等外部环境对主车的影响进行感知。
评估器则会根据场景信息和障碍物信息判断出障碍物的轨迹或意图。预测器则根据短期的预测轨迹和意图判断障碍物等外部环境相对长期的轨迹。这将为未来汽车的规划提供重要的参考。算法层面通常以 RNN 为主。
在这里插入图片描述

1.1.3、 规划:思考如何行动

规划指找到合理路径来到达目的地。规划通常分为全局路径规划、行为规划与运动规划几个部分。其中,全局路径规划指智能汽车依靠地图规划出理想状态下到达目的地的路径。行为规划则是主车在实际行驶的过程中,面临实时的交通环境,做出的各类驾驶行为,如跟车、换道、避让等。运动规划生成与驾驶行为对应的驾驶轨迹,包含路径规划和速度规划。最后再采用一些优化方式让变道加速等行为变得平顺以满足舒适性要求。算法层面,通常采用基于规则的规划决策算法,前沿的玩家也开始引入机器学习等方式,以提升决策效能。
在这里插入图片描述

1.2大模型横空出世,自动驾驶奇点来临

早期自动驾驶方案采用激光雷达+高精度地图为主。早期市场以传统计算机视觉和专家系统为基础构建辅助驾驶功能,随后人工智能的蓬勃发展让深度学习在自动驾驶领域被广泛使用,以 waymo 为代表的自动驾驶先驱玩家开创了激光雷达+高精度地图的感知范式,Cruise、百度等巨头纷纷效仿。该方案中,对道路结构、车道线等静态环境元素的感知强依赖高精度地图,而实时的动静态障碍物信息则强依赖激光雷达。高精地图成为一项“基础设施”,将很多在线难以解决的问题提前存储到地图数据中,行车时作为一项重要的感知数据来源,减轻传感器和控制器的压力。由于该方案只能在有图地区行驶,也被一些人形象的称为“有轨电车”。
在这里插入图片描述
高昂的单车成本和高精度地图成为自动驾驶大规模推广瓶颈。Robotaxi 成本高昂(Yole 统计早期 Waymo 为代表的的自动驾驶汽车改装成本约为 20 万美元),高精度地图采集制作以及合规要求繁杂(量产落地过程中,高精度地图面临:采集成本高;人工修图制图费时费力;地图鲜度不足;国内法规严格等困难),带来该方案的泛化性较差。经过数十年的发展,Robotaxi 的使用范围仍被限制在特定区域,使用对象也仅局限在商用车领域。市场亟待出现一种单车性能强大、成本低廉的自动驾驶解决方案。
BEV+Transformer 横空出世,大模型推动自动驾驶迈向普及
2021 年特斯拉推出 BEV+transformer、重感知轻地图的自动驾驶解决方案,开启了自动驾驶行业新的篇章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/643376.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【大模型系列】指令微调

概述 指令微调(Instruction Tuning)是指使用自然语言形式的数据对预训练后的大语言模型进行参数微调,22年谷歌ICLR论文中提出这个概念。在其它文献中,指令微调也被称为有监督微调(Supervised Fine-tuning)…

Python进阶编程 --- 3.闭包、装饰器、设计模式、多线程、网络编程、正则表达式、递归

文章目录 第三章:3.1 闭包3.2 装饰器语法糖写法 3.3 设计模式3.3.1 单例模式3.3.2 工厂模式 3.4 多线程3.4.1 进程、线程和并行执行3.4.2 多线程编程 3.5 网络编程3.5.1 Socket3.5.2 服务端开发3.5.3 客户端开发 3.6 正则表达式3.6.1 基础匹配3.6.2 元字符匹配单字符…

QT客户端开发的技术难点

QT是一种功能强大且灵活的跨平台应用程序开发框架,但也存在一些技术难点,需要开发者仔细考虑和克服。以下是一些常见的QT开发技术难点。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1. 跨平台兼容性 QT框架…

Kafka学习笔记(二、linux和docker安装及使用demo)

1.安装启动 1.1.下载解压 官网下载地址将下载的tar包上传到服务器一个目录,然后解压$ tar -xzf kafka_2.13-3.7.0.tgz $ cd kafka_2.13-3.7.01.2. 启动环境 需安装Jdk8,Kafka可以使用ZooKeeper或KRaft启动。 ZooKeeper启动 运行如下命令,…

FebHost:科技企业如何规划并注册.AI域名?

为确保企业使用.AI域名的方式准确反映其对人工智能技术的关注,企业应考虑以下步骤: 了解法律和合规要求: 第一步是了解与 .AI 域名相关的独特法律和合规要求。由于.AI域名源于安圭拉,企业必须遵守安圭拉的限制和法律规定。这包括…

绿城中国北森商业综合推理40分钟28题管理人才盘点领导选拔总经理竞聘考什么?

复杂信息理解批判性评估 策略性推理概念性推理 40分钟题库实时时更新 晋升通过率>95% 绿城人寿移动航油等国企 各维度说明 ①复杂信息理解:洞察文字、图表等资料的能力,能否快速抓住复杂信息中的要点、提取出关键信息 ②批判性评估:批判性质疑的能力&#xff0…

【框架 - Nodejs中的有限状态机】

什么是有限状态机 有限状态机,finite state machine 缩写FSM ,一种数学模型和计算机科学概念,用于描述对象在计算过程中的状态转换。它由一组状态、一组可触发的事件以及状态转移规则组成。 主要组成部分: 状态(Sta…

Amazon云计算AWS之[2]弹性计算云EC2

文章目录 说明EC2基本架构Amazon机器映象(AMI)实例(Instance)弹性块存储(EBS) EC2关键技术地理区域和可用区域EC2通信机制弹性负载均衡监控服务自动缩放服务管理控制台 EC2安全及容错机制EC2弹性IP地址 说明…

用 LM Studio 1 分钟搭建可在本地运行大型语言模型平台替代 ChatGPT

📌 简介 LM Studio是一个允许用户在本地离线运行大型语言模型(LLMs)的平台,它提供了一种便捷的方式来使用和测试这些先进的机器学习模型,而无需依赖于互联网连接。以下是LM Studio的一些关键特性: 脱机&am…

排序算法:顺序查找

简介 顺序查找(也称为线性查找)是一种简单直观的搜索算法。按照顺序逐个比较列表或数组中的元素,直到找到目标元素或搜索完整个列表。 应用场景 数据集比较小,无需使用复杂的算法。数据集没有排序,不能使用二分查找…

OpenHarmony实战开发-

简介 SmartPerf-Host是一款深入挖掘数据、细粒度展示数据的性能功耗调优工具,可采集CPU调度、频点、进程线程时间片、堆内存、帧率等数据,采集的数据通过泳道图清晰地呈现给开发者,同时通过GUI以可视化的方式进行分析。该工具当前为开发者提…

Maven基础篇7

私服-idea访问私服与组件上传 公司团队开发流程 本地上传–>repository–>私服 其他成员从私服拿 1.项目完成后发布到私服 在pom文件最后写上发布的配置管理 ​ //写发布的url也就是你发布到哪一个版本,以及写入id ​ ​ 发布的时候,将项…