1、FastMAC: Stochastic Spectral Sampling of Correspondence Graph
中文标题:FastMAC: 随机谱采样对应关系图
简介:在计算机视觉中,3D对应关系是指一对3D点,构成了基本概念。一组具有兼容边的3D对应关系形成了对应关系图,这在最先进的3D点云配准方法中扮演着重要角色,如基于最大团的方法(MAC)。尽管如此,对这一图的特性尚未完全理解。因此,我们进行了首次研究,将图信号处理引入对应关系图领域。我们利用对应关系图上的广义度信号,并致力于采用能够保留高频分量的采样策略。为了解决耗时的奇异值分解问题,我们采用了随机近似采样策略。因此,我们提出的方法的核心是对应关系图的随机谱采样。作为一个应用案例,我们开发了一个名为FastMAC的完整3D配准算法,实现了实时速度,同时几乎没有性能损失。通过大量实验验证,我们证明FastMAC适用于室内和室外基准测试。举例来说,FastMAC在KITTI数据集上将MAC的速度提升了80倍,同时保持高配准成功率。我们的代码已在https://github.com/Forrest-110/FastMAC上公开。
2、3DFIRES: Few Image 3D REconstruction for Scenes with Hidden Surface
中文标题:3DFIRES:用于具有隐藏表面的场景的少图像3D重建
简介:这篇文章介绍了一种名为3DFIRES的创新系统,用于从单个姿态图像进行场景级别的三维重建。3DFIRES的设计目标是在仅有一个视角的情况下,重建未曾见过的场景的完整几何形状,包括隐藏的表面。当输入包含多个视角时,我们的方法能够在所有相机视锥内进行全面的重建。我们方法的一个关键特点是在特征级别上融合多视角信息,从而实现连贯和全面的三维重建。我们利用大规模真实场景数据集中的非密集扫描进行系统训练。研究结果表明,即使只有一个输入,我们的方法在效果上与单视角重建方法相当,并且在稀疏视角三维重建的定量和定性测量方面超过了现有技术。
3、MonoOcc: Digging into Monocular Semantic Occupancy Prediction
中文标题:MonoOcc: 深入研究单目视觉语义占有预测
简介:单目语义占据预测旨在从2D图像中推断完整的3D几何和语义信息,引起了广泛关注,尤其是在增强自动驾驶车辆的3D感知方面。然而,现有方法存在挑战,因为它们依赖于复杂的级联框架,信息相对有限,仅依赖于整个网络输出的监督,单帧输入和小型骨干。这些挑战导致框架难以优化,产生较差的预测结果,尤其是对于小型和长尾对象。为了解决这些问题,提出了MonoOcc。该方法通过引入辅助语义损失和使用图像条件交叉注意力模块来优化体素特征,改进了单目占据预测框架。此外,采用蒸馏模块将来自更大图像骨干的时间信息和更丰富知识传输到单目语义占据预测框架中,同时保持低硬件成本。这些优势使得该方法在基于相机的SemanticKITTI场景完成基准测试中表现出最先进的性能。您可以在https://github.com/ucaszyp/MonoOcc访问代码和模型。