论文解读 | 基于中心的三维对象检测与跟踪

原创 | 文 BFT机器人

图片

CenterPoint与传统基于框的3D物体检测器和跟踪器不同之处在于,它将3D物体表示、检测和跟踪为点,而不是使用边界框。这种方法具有几个优点,包括减少物体检测器的搜索空间,简化下游任务(如跟踪),并使设计比以前的方法快得多的有效的两阶段细化模块成为可能。此外,CenterPoint允许骨干网络学习物体的旋转不变性和它们相对旋转的旋转等变性。检测是一种简单的经过细化的局部峰提取,跟踪是一种最近距离匹配。

图片

基于中心的框架的检测和跟踪对象

本文主要描述了一种名为CenterPoint的新框架,该框架将3D物体表示、检测和跟踪为点,而不是使用边界框。该方法简化了检测和跟踪过程并在基准数据集上实现了最先进的性能。本文的作者还介绍了一种新的中心点检测头,但依赖于现有的3D骨干网络(如VoxelNet或PointPillars)。

我们的方法克服了传统基于框的检测器的挑战,并简化了3D对象跟踪。在前期准备工作中,我们首先回顾了当前3D对象检测和跟踪领域的最新方法,包括基于框、基于锚点和基于点的方法。我们还讨论了这个领域中使用的流行数据集和评估指标。然后,我们介绍了我们的方法的主要思想和贡献,并详细描述了我们的CenterPoint框架的设计和实现。最后,我们在几个基准数据集上进行了实验,并展示了我们的方法的优越性能。

CenterPoint首先使用关键点检测器检测对象的中心,并回归到其他属性,包括3D大小、3D方向和速度。在第二阶段,它使用对象上的附加点特征来细化这些估计值。由此产生的检测和跟踪算法简单、高效、有效。CenterPoint在nuScenes基准测试中取得了最先进的3D检测和跟踪性能,单模型的NDS为65.5,AMOTA为63.8。在Waymo开放数据集上,CenterPoint的性能大大优于所有先前的单模型方法,并在所有仅使用激光雷达的方法中排名前列。

对中心点框架的概述

文中描述到使用一个标准的基于激光雷达的骨干网络如VoxelNet或PointPillars来构建输入点云的表示。然后,它将这个表示展平成一个俯视图,并使用一个标准的基于图像的关键点检测器来找到物体的中心。对于每个检测到的中心,它从中心位置的点特征回归到所有其他物体属性,例如3D大小、方向和速度。此外,我们使用一个轻量级的第二阶段来优化物体位置。这个第二阶段在估计的物体3D边界框的每个面的3D中心提取点特征。它恢复了由于步幅和有限的感受视野而丢失的局部几何信息,并带来了较小的成本和相当大的性能提升。

01

实验结果

本文首先在Waymo和nuScenes的测试集上展示了我们的三维检测结果。这两个结果都使用了一个单一的中心点-体素模型。在Waymo测试集上,我们的模型对车辆检测达到71.8级2级mAPH,对行人检测达到66.4级2级mAPH,超过了之前的方法达到7.1%的车辆mAPH,行人达到10.6%的mAPH。在nuScenes上,我们的模型在多尺度输入和多模型集成方面比去年的挑战赢家CBGS要好5.2%的mAP和2.2%的NDS。

图片

文中我们的模型在神经平面度量(PKL)下显著优于所有其他提交,这是组织者在提交排行榜后评估的隐藏度量。这突出了我们的框架的泛化能力。

对于3D跟踪来说,中心点在Waymo测试集上的跟踪性能,我们的跟踪不需要一个单独的运动模型,并且运行的时间可以忽略不计,在检测之上为1ms。

在我们文中的两阶段中心点模型中,只使用了二维CNN特征图中的特征。但是以往的方法也提出利用体素特征进行第二阶段的细化。

图片

中心点对Waymo验证的定性结果

02

结论

本文提出了一个基于中心的框架,同时用于三维目标检测和跟踪激光雷达点云。主要是使用一个标准的3D点云编码器,在头部有几个卷积层,以产生一个鸟视图热图和其他密集的回归输出。中心点简单、接近实时性,并在Waymo和nuScenes基准上进行了多次测试实现了最先进的性能。

作者 | 张哲宇

排版 | 小河

审核 | 橙橙

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/102862.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自然语言处理——数据清洗

一、什么是数据清洗 数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 ——百度百科 二、为什么要数据清洗 现实生…

分支创建查看切换

1、初始化git目录,创建文件并将其推送到本地库 git init echo "123" > hello.txt git add hello.txt git commit -m "first commit" hello.txt$ git init Initialized empty Git repository in D:/Git/git-demo/.git/ AdministratorDESKT…

无需编程经验,也能制作租车预约微信小程序,快速上手

现在,制作租车预约微信小程序不再需要编程经验,只需几个简单的步骤,您就可以拥有自己的租车预约微信小程序。在本文中,我们将介绍如何利用乔拓云网后台来制作租车预约微信小程序,并实现您所需的功能。 首先&#xff0c…

Android——数据存储(一)(二十一)

1. 数据存储 1.1 知识点 (1)掌握Android数据存储的分类; (2)可以使用SharedPreferences存储数据。 1.2 具体内容 对于我们数据的存储而言,Android一共提供了5个数据存储的方式:SharedPrefe…

远程工作面试:特殊情况下的面试技巧

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

JavaEE初阶(1)(冯诺依曼体系、CPU、CPU基本原理、如何衡量CPU的好坏?指令、操作系统、操作系统“内核”)

目录 冯诺依曼体系(Von Neumann Architecture) CPU CPU基本原理: 如何衡量CPU的好坏? 1、主频(时钟速度): 2、核心数: 指令 操作系统 操作系统“内核” 冯诺依曼体系&#x…

十二、集合(5)

本章概要 for-in 和迭代器 适配器方法惯用法 本章小结 简单集合分类 for-in和迭代器 到目前为止,for-in 语法主要用于数组,但它也适用于任何 Collection 对象。实际上在使用 ArrayList 时,已经看到了一些使用它的示例,下面是它…

【2023高教社杯】B题 多波束测线问题 问题分析、数学模型及参考文献

【2023高教社杯】B题 多波束测线问题 问题分析、数学模型及参考文献 1 题目 1.1 问题背景 多波束测深系统是利用声波在水中的传播特性来测量水体深度的技术,是在单波束测深的基础上发展起来的,该系统在与航迹垂直的平面内一次能发射出数十个乃至上百个…

使用Idea导入mybatis dependence时爆红解决方法

<dependency><groupId>org.mybatis</groupId><artifactId>mybatis</artifactId><version>3.5.5</version></dependency>如上在pom.xml中配置mybatis的dependence1时出现爆红的情况。 解决方法 找到idea编辑器右侧的maven按钮…

如何用Jmeter编写脚本压测?

随着商业业务不断扩张&#xff0c;调用adsearch服务频率越来越高&#xff0c;所以这次想做个压测&#xff0c;了解目前多少并发量可以到达adsearch服务的界值。 这次选用的jmeter压测工具&#xff0c;压测思路如图&#xff1a; 一、日志入参 日志选取的adsearch 的 getads部分…

【图文并茂】c++介绍之队列

1.1队列的定义 队列&#xff08;queue&#xff09;简称队&#xff0c;它也是一种操作受限的线性表&#xff0c;其限制为仅允许在表的一端进行插入操作&#xff0c;而在表的另一端进行删除操作 一些基础概念&#xff1a; 队尾&#xff08;rear&#xff09; &#xff1a;进行插…

从智能手机到智能机器人:小米品牌的高端化之路

原创 | 文 BFT机器人 前言 在前阵子落幕的2023世界机器人大会“合作之夜”上&#xff0c;北京经济技术开发区管委会完成了与世界机器人合作组织、小米机器人等16个重点项目签约&#xff0c;推动机器人创新链和产业链融合&#xff0c;其中小米的投资额达到20亿&#xff01; 据了…