【论文笔记】LiDAR-based 4D Occupancy Completion and Forecasting

原文链接:https://arxiv.org/abs/2310.11239

I. 引言

占用体素网格相关的感知任务主要有语义场景补全(SSC)和占用预测。SSC能预测可见区域和不可见区域的语义,而占用预测则预测场景的时间变化。两个任务均基于部分观测,幻想(空间上或时间上的)未知环境。

在这里插入图片描述
目前的方法分开考虑两个任务,但两个任务是相互关联的。本文提出占用补全与预测(OCF)任务,模型输入一组连续的激光雷达扫描,并产生以体素表达的、补全的占用网格序列。该任务的挑战包括:

  1. 稀疏到密集的重建:激光雷达产生的点云是稀疏的,场景补全需要算法能插值数据间隙并重建场景表面。
  2. 部分到完整的幻想:需要算法推理可视和不可视的空间,并保证空间的一致性。
  3. 3D到4D的预测:需要算法能建模环境的时间动态,其中包括物体的运动。

关于模型的监督,本文使用时间积累且运动补偿的激光雷达点云,体素化得到真值。

III. 方法

A. 问题描述

给定点云输入,目标是以占用网格的表达方式在一定的时空范围内补全并预测场景。输入的连续点云表达为体素网格 P = { P t } t = − T 0 \mathcal{P}=\{P_t\}_{t=-T}^0 P={Pt}t=T0,期望的输出为补全的体素网格序列 Y = { Y t } t = 0 T \mathcal{Y}=\{Y_t\}_{t=0}^T Y={Yt}t=0T。所有输入和输出位于同一坐标系下,且体素分辨率和表达范围相同,即 P t , Y t ∈ { 0 , 1 } H × W × L P_t,Y_t\in\{0,1\}^{H\times W\times L} Pt,Yt{0,1}H×W×L,其中0或1表示体素为空或被占用。

B. 基准方案

包括PCF、ConvLSTM、Conv3D。

C. 损失函数

BCE损失:将训练视为体素的二元分类。使用二元交叉熵损失,求取各帧损失的均值。

软性IoU损失:可以更好地评估模型预测的置信度,且其“软性”使得该指标可微。
L ( y , y ~ ) = − 1 ∣ C ∣ ∑ C ∑ V y ⋅ y ~ ∑ V y + y ~ − y ⋅ y ~ \mathcal{L}(y,\tilde y)=-\frac{1}{|C|}\sum_C\frac{\sum_Vy\cdot\tilde y}{\sum_Vy+\tilde y-y\cdot\tilde y} L(y,y~)=C1CVy+y~yy~Vyy~

其中 C C C为mini-batch大小, V V V为一个样本中的体素集合, y ∈ { 0 , 1 } y\in\{0,1\} y{0,1}为占用真值, y ~ \tilde y y~为预测的占用概率。3D卷积模型的训练使用上述两个损失之和。

IV. 数据综合处理

A. 处理的挑战和技术

概述:阻碍占用预测发展的因素主要是真实占用的获取难度,即激光雷达无法获取所有物体和结构的密集占用、也不能获取遮挡区域的占用。

“时空管道”:直接将多帧点云积累,会在动态物体处产生“时空管道”的问题。本文使用实例标签将动态物体多帧同步。

未知体素:当多帧点云均未扫描到某处时,对应的占用情况是未知的。使用射线投射算法,检查所有不能被扫描的体素,在监督与评估时忽略之。

自车运动:由于不希望模型学习自车运动情况,将所有输入和真值均转化到 t = 0 t=0 t=0的坐标系下。

V. 实验

B. 所有数据集上的共同结果

不同模型结构:Conv3D的性能最优;而PCF因为把时间和高度维度放到一起输入2D卷积处理,性能较差。ConvLSTM性能同样较低。

相同输入下的不同输出间隔:使用相同输入预测不同输出长度时,所有方法的性能均有下降,但降低不明显。这是因为静态体素占大部分,导致难以预测的动态物体对性能的影响较少。

多种输入间隔下的相同输出:提供更多输入帧时,性能均有上升。因为更多时间信息能使模型更准确地抓捕动态特征;此外也能减少单帧噪声的影响,而关注多帧一致性。

时间退化:对各帧分别进行评估,可知所有方法均随 t t t的增大而降低性能。此外,改变模型结构相比添加输入帧数,对性能的影响更显著。

跨域一致性:由于不同数据集上的规律基本相同,这表明OCF任务对传感器设置等因素不敏感。

C. 跨域适应的结果

在一个数据集上训练,其余数据集上测试,相比在同一数据集上训练的情况,性能有所下降。

D. 模型规格

Conv3D模型的性能是以模型的计算复杂度为代价的。ConvLSTM的模型参数与输入输出的序列长度无关。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/326412.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Redis端口】通过修改端口一个计算机上可以运行两个redis

一个计算机上可以运行多个Redis实例。每个Redis实例都会监听一个特定的端口,所以只要确保每个实例使用的端口不冲突,就可以在同一台计算机上运行多个Redis实例。例如,你可以配置一个Redis实例监听6379端口,另一个Redis实例监听638…

玩转Mysql 二(MySQL的目录结构与表结构)

一路走来,所有遇到的人,帮助过我的、伤害过我的都是朋友,没有一个是敌人。 一、MYSQL目录结构及命令存放路径 1、查看MYSQL数据文件存放路径 mysql> show variables like datadir; 注意:生成环境要提前规划好数据存放目录,存储一般以T为单位闪盘。 2、MYSQL命令存放…

四个模型建模及数据分析整理(基于Titanic数据集)

目录 介绍: 二、数据 2.1引用数据 2.2检查缺失数据 2.2.1手动检查缺失数据 2.2.2查看某一个特征值为空数据 2.3补充缺失数据 2.3.1盒图 2.3.2手动用均值填补缺失数据 2.3.3手动用类别填补缺失数据 三、数据分析 3.1男女生存比例 3.2男女生存数 3.3船舱级…

java 打印日志的几种方式

java 打印日志的几种方式 Java 日志框架进化史日志门面与日志系统 Log4jslf4jLog4j2slf4jLogbackslf4j 一、先简单介绍五种 (1)最简单的方式,就是system.println.out(error) ,这样直接在控制台打印消息了; (2&#xff…

淘宝京东1688商品详情API接口,搜索商品列表接口

前言 在实际工作中,我们需要经常跟第三方平台打交道,可能会对接第三方平台API接口,或者提供API接口给第三方平台调用。 那么问题来了,如果设计一个优雅的API接口,能够满足:安全性、可重复调用、稳定性、好…

iPhone 恢复出厂设置后如何恢复数据

如果您在 iPhone 上执行了恢复出厂设置,您会发现所有旧数据都被清除了。这对于清理混乱和提高设备性能非常有用,但如果您忘记保存重要文件,那就是坏消息了。 恢复出厂设置后可以恢复数据吗?是的!幸运的是,…

第8课 将推流端与播放端合并为一对一音视频聊天功能

在第二章的第7课,我们实现了一个推流端,可以把音视频推送到rtmp服务器;在第一章的第4课,我们实现了一个播放器,可以正常播放rtmp音视频流。聪明的你应该可以想到了:把推流端和播放端合并在一起,…

迭代实现二叉树的遍历(算法村第七关黄金挑战)

迭代实现前序遍历 144. 二叉树的前序遍历 - 力扣(LeetCode) 题解的迭代方式 因为在递归的过程中使用了系统栈,所以在迭代的解法中常用 Stack 来模拟系统栈,来模拟递归。 首先创建一个 Stack 用来存放节点,此时 Sta…

SpringCloud系列篇:入门讲解Spring Cloud是什么

🥳🥳Welcome Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于SpringCloud的相关操作吧 目录 🥳🥳Welcome Huihuis Code World ! !🥳🥳 一.Spring Cloud是什么 二.Spring …

哈尔滨爆火的背后有什么值得我们学习的,2024普通人如何创业/2024风口行业

这个冬天,“南方小土豆”带火东北冰雪游。“冰城”黑龙江哈尔滨的文旅市场异常火爆,元旦假期3天,哈尔滨市累计接待游客304.79万人次,实现旅游总收入59.14亿元。旅游总收入达到历史峰值。哈尔滨旅游怎么就爆火了?背后究…

彻底卸载 Microsoft Edge

如果您想学习如何在 Windows 10 上卸载 Microsoft Edge,您并不孤单。尽管目前基于 Chromium 的 Microsoft 浏览器版本比以前的 Edge 版本要好得多,但它仍然是一个不受欢迎的浏览器。 尽管您需要在 PC 上预装浏览器才能安装其他浏览器,但许多…

AcWing 853. 有边数限制的最短路—bellman-ford算法

问题链接:AcWing 853. 有边数限制的最短路 问题描述 分析 bellman-ford算法可以用来解决带负权边的最短路问题,这是相比于DJ算法优秀的地方,但是要注意的是能解决带负权边的最短路问题,如果负权边构成了负权回路,那就有可能求不出…