UniDepth:通用单目度量深度估计

UniDepth:通用单目度量深度估计
    精确的单目度量深度估计(MMDE)对于解决3D感知和建模中的下游任务至关重要。然而,最近MMDE方法的显著准确性与其训练领域不符。即使存在适度的域间隙,这些方法也无法推广到看不见的域,这阻碍了它们的实际应用。提出了一种新的模型UniDepth,能够从单个图像跨域重建度量3D场景。与现有的MMDE方法不同,UniDepth在推理时直接从输入图像中预测度量3D点,而无需任何额外信息,从而寻求一种通用且灵活的MMDE解决方案。特别是,UniDepth实现了一个自提示的相机模块,可以预测密集的相机表示,以调节深度特征。改进的模型利用了伪球面输出表示,该表示将相机和深度表示分开。此外,提出了一种几何不变性损失,以提高相机提示的深度特征的不变性。即使与直接在测试域上训练的方法相比,在零样本制度下对十个数据集的全面评估也始终证明了UniDepth的优越性能。
    新方法UniDepth可以直接预测场景中,只有一个图像作为输入的3D点,如图4-13中。
 
图4-13 新方法UniDepth可以直接预测场景中,只有一个图像作为输入的3D点
在图4-13中,UniDepth结合了相机自提示机制,并利用了由方位角、仰角和深度

 定义的伪球面3D输出空间。该设计有效地将相机和深度优化分开,避免了由于深度相关误差(

 )导致的相机模块的梯度。

UniDepth模型架构,如图4-14所示。
 
图4-14 UniDepth模型架构
在图4-14中,UniDepth仅利用输入图像来生成3D输出(

 )。它从相机模块中引导密集的相机预测(

 ),通过交叉注意力层将场景尺度上的先验知识注入深度模块。相机表示对应于方位角和仰角。几何不变性损失(

 )加强了基于不同几何增强(

 ,

 )的相机的深度特征张量之间的一致性。停止梯度应用于摄像机模块的编码特征(

 ),以防止摄像机梯度主导编码器中的深度梯度。深度输出(

 )是通过三个自关注块与可学习的2x上采样交织获得的。最终输出是相机和深度张量(

 )的连接,为

 创建了两个独立的优化空间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/844392.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

写一句话:NOIP之后,没有完结的故事与青春

睡觉睡觉,一切都好。睡觉最好。可能是两句话? 周五和助教一起吃饭,她说:不要老是说自己退役了。以后还有各种比赛,上了大学还有 acm。路还很长。 这两天和宁老师一起行动,宁老师真的是很可爱的很好的老师(如果 N 老师您看到了,那我想说的是老师特别幽默有趣,谢谢老师^…

写一句话:没有完结的故事与青春

睡觉睡觉,一切都好。睡觉最好。可能是两句话? 周五和助教一起吃饭,她说:不要老是说自己退役了。以后还有各种比赛,上了大学还有 acm。路还很长。 这两天和宁老师一起行动,宁老师真的是很可爱的很好的老师(如果 N 老师您看到了,那我想说的是老师特别幽默,谢谢老师^^)。…

攻防世界-不仅仅是RSA

一、题目 给出以下几个文件py文件代码如下二、解题思路 1、听C1,C2的音频, 由长短声很快确定是摩斯密码,上网一搜,果然有在线摩斯密码音频解密网站,上去解密即可这里初步判断可能是密文 2、进一步分析代码分析代码发现这就是一个简单的RSA加密算法,并且有两个不同公钥的RSA…

Web自动化001-Web自动化前端基础及Selenium原理和环境搭建

Web自动化001-Web自动化前端基础及Selenium原理和环境搭建 Web自动化前端基础及Selenium原理和环境搭建1.什么是web自动化测试?web自动化测试是指利用自动化的测试工具或者框架,通过编写脚本和模拟用户在web页面上的任意操作web自动化测试是一种比较高效,准确、可重复测试的…

道路缺陷智能检测系统

道路缺陷智能检测系统的核心是基于YOLOX算法结合OpenCV, 道路缺陷智能检测系统能够通过无人机或车载相机捕获的道路图像,准确识别出路面的各类病害。无论是细微的龟裂还是明显的坑洞,系统都能迅速发现并标记出来。通过深度学习技术,系统能够学习并识别病害的特征,随着数据…

皮带输送机空载识别检测系统

皮带输送机空载识别检测系统核心在于通过现场监控摄像机,皮带输送机空载识别检测系统实时监测皮带输送机上是否有物料。系统的工作原理是首先利用YOLOvX算法对摄像机捕获的图像进行处理,识别出图像中的物料。然后,通过设定的阈值来判断物料是否存在。当监控画面中没有物料存…

泥石流识别摄像机

泥石流识别摄像机通过高清摄像头捕捉山体图像,泥石流识别摄像机利用YOLOX算法对能够对山体的微小变化进行精确捕捉,并通过深度学习不断优化其识别能力,识别出山体的异常变化,如泥石流滑坡、落石等迹象。一旦检测到这些异常,系统会立即启动报警机制,将预警信息发送给相关部…

课堂教学行为质量评估检测系统

课堂教学行为质量评估检测系统通过在教室内部署摄像头,课堂教学行为质量评估检测系统实时捕捉课堂视频,利用深度学习算法对视频流进行智能分析,能够准确识别出学生的各种课堂行为,如起立、读写、举手、听讲、趴桌子、玩手机等。这些行为数据被量化,为后续的教学质量评估提…

gitlab的数据备份和恢复

作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 目录一.手动备份配置文件二.手动备份数据三.模拟删除meta-data项目数据1 删除meta-data项目2 meta-data被删除成功四.通过备份恢复meta-data项目数据1 恢复前需要先停止puma和sidekiq服务2 恢复时指定备份文件…

Linux中实现根据scaffold名称从fasta文件中提取数据(scaffold名称长)

001、(base) [sy20213040737@admin2 test]$ ls chr.list test.fa (base) [sy20213040737@admin2 test]$ cat test.fa ## 测试fasta文件 >chr1 xxxx aaaabbb cccccddd >chrx eee jj aaaaaabbbbbc cccccdddd >chr3 iii rr aaaaaaaaa aaaaaaaaa bbbbbbbb >c…

SpringMVC-06-SSM整合

1、环境要求IDEA MySQL 8.x Tomcat 9 Maven 3.6这只是大型软件要求,项目相关的jar包依赖将在Maven中配置。 项目前置技能:MySQL、Mybatis、Spring、JavaWeb、简单的前端知识。 2、数据库表 创建一个存放书籍数据的数据库表 CREATE DATABASE `ssmbuild`;USE `ssmbuild`;DROP T…

高通sku lisence升级

最近在搞高通的license升级,也就是提速cpu/gpu性能,记录一下一、背景 高通为了满足不同阶段开发需求,对soc性能做了一些特定定义,因此我们需要根据产品的开发阶段或者需求变化,使用对应的性能指标。不同license下的cpu gpu性能表现目前我们ES6代码默认使用的是CCCC对应的S…