UniDepth：通用单目度量深度估计-编程知识

UniDepth：通用单目度量深度估计

news/2025/2/13 2:11:16/文章来源:https://www.cnblogs.com/wujianming-110117/p/18579290

UniDepth：通用单目度量深度估计

精确的单目度量深度估计（MMDE）对于解决3D感知和建模中的下游任务至关重要。然而，最近MMDE方法的显著准确性与其训练领域不符。即使存在适度的域间隙，这些方法也无法推广到看不见的域，这阻碍了它们的实际应用。提出了一种新的模型UniDepth，能够从单个图像跨域重建度量3D场景。与现有的MMDE方法不同，UniDepth在推理时直接从输入图像中预测度量3D点，而无需任何额外信息，从而寻求一种通用且灵活的MMDE解决方案。特别是，UniDepth实现了一个自提示的相机模块，可以预测密集的相机表示，以调节深度特征。改进的模型利用了伪球面输出表示，该表示将相机和深度表示分开。此外，提出了一种几何不变性损失，以提高相机提示的深度特征的不变性。即使与直接在测试域上训练的方法相比，在零样本制度下对十个数据集的全面评估也始终证明了UniDepth的优越性能。

新方法UniDepth可以直接预测场景中，只有一个图像作为输入的3D点，如图4-13中。

图4-13 新方法UniDepth可以直接预测场景中，只有一个图像作为输入的3D点

在图4-13中，UniDepth结合了相机自提示机制，并利用了由方位角、仰角和深度

定义的伪球面3D输出空间。该设计有效地将相机和深度优化分开，避免了由于深度相关误差（

）导致的相机模块的梯度。

UniDepth模型架构，如图4-14所示。

图4-14 UniDepth模型架构

在图4-14中，UniDepth仅利用输入图像来生成3D输出（

）。它从相机模块中引导密集的相机预测（

），通过交叉注意力层将场景尺度上的先验知识注入深度模块。相机表示对应于方位角和仰角。几何不变性损失（

）加强了基于不同几何增强（

，

）的相机的深度特征张量之间的一致性。停止梯度应用于摄像机模块的编码特征（

），以防止摄像机梯度主导编码器中的深度梯度。深度输出（

）是通过三个自关注块与可学习的2x上采样交织获得的。最终输出是相机和深度张量（

）的连接，为

创建了两个独立的优化空间。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/844392.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

写一句话：NOIP之后，没有完结的故事与青春

写一句话：NOIP之后，没有完结的故事与青春

睡觉睡觉，一切都好。睡觉最好。可能是两句话？周五和助教一起吃饭，她说：不要老是说自己退役了。以后还有各种比赛，上了大学还有 acm。路还很长。这两天和宁老师一起行动，宁老师真的是很可爱的很好的老师（如果 N 老师您看到了，那我想说的是老师特别幽默有趣，谢谢老师^…

阅读更多...

写一句话：没有完结的故事与青春

写一句话：没有完结的故事与青春

睡觉睡觉，一切都好。睡觉最好。可能是两句话？周五和助教一起吃饭，她说：不要老是说自己退役了。以后还有各种比赛，上了大学还有 acm。路还很长。这两天和宁老师一起行动，宁老师真的是很可爱的很好的老师（如果 N 老师您看到了，那我想说的是老师特别幽默，谢谢老师^^）。…

阅读更多...

攻防世界-不仅仅是RSA

攻防世界-不仅仅是RSA

一、题目给出以下几个文件py文件代码如下二、解题思路 1、听C1,C2的音频，由长短声很快确定是摩斯密码，上网一搜，果然有在线摩斯密码音频解密网站,上去解密即可这里初步判断可能是密文 2、进一步分析代码分析代码发现这就是一个简单的RSA加密算法，并且有两个不同公钥的RSA…

阅读更多...

Web自动化001-Web自动化前端基础及Selenium原理和环境搭建

Web自动化001-Web自动化前端基础及Selenium原理和环境搭建

Web自动化001-Web自动化前端基础及Selenium原理和环境搭建 Web自动化前端基础及Selenium原理和环境搭建1.什么是web自动化测试？web自动化测试是指利用自动化的测试工具或者框架，通过编写脚本和模拟用户在web页面上的任意操作web自动化测试是一种比较高效，准确、可重复测试的…

阅读更多...

道路缺陷智能检测系统

道路缺陷智能检测系统

道路缺陷智能检测系统的核心是基于YOLOX算法结合OpenCV，道路缺陷智能检测系统能够通过无人机或车载相机捕获的道路图像，准确识别出路面的各类病害。无论是细微的龟裂还是明显的坑洞，系统都能迅速发现并标记出来。通过深度学习技术，系统能够学习并识别病害的特征，随着数据…

阅读更多...

皮带输送机空载识别检测系统

皮带输送机空载识别检测系统

皮带输送机空载识别检测系统核心在于通过现场监控摄像机，皮带输送机空载识别检测系统实时监测皮带输送机上是否有物料。系统的工作原理是首先利用YOLOvX算法对摄像机捕获的图像进行处理，识别出图像中的物料。然后，通过设定的阈值来判断物料是否存在。当监控画面中没有物料存…

阅读更多...

泥石流识别摄像机

泥石流识别摄像机

泥石流识别摄像机通过高清摄像头捕捉山体图像，泥石流识别摄像机利用YOLOX算法对能够对山体的微小变化进行精确捕捉，并通过深度学习不断优化其识别能力，识别出山体的异常变化，如泥石流滑坡、落石等迹象。一旦检测到这些异常，系统会立即启动报警机制，将预警信息发送给相关部…

阅读更多...

课堂教学行为质量评估检测系统

课堂教学行为质量评估检测系统

课堂教学行为质量评估检测系统通过在教室内部署摄像头，课堂教学行为质量评估检测系统实时捕捉课堂视频，利用深度学习算法对视频流进行智能分析，能够准确识别出学生的各种课堂行为，如起立、读写、举手、听讲、趴桌子、玩手机等。这些行为数据被量化，为后续的教学质量评估提…

阅读更多...

gitlab的数据备份和恢复

gitlab的数据备份和恢复

作者：尹正杰版权声明：原创作品，谢绝转载！否则将追究法律责任。目录一.手动备份配置文件二.手动备份数据三.模拟删除meta-data项目数据1 删除meta-data项目2 meta-data被删除成功四.通过备份恢复meta-data项目数据1 恢复前需要先停止puma和sidekiq服务2 恢复时指定备份文件…

阅读更多...

Linux中实现根据scaffold名称从fasta文件中提取数据（scaffold名称长）

Linux中实现根据scaffold名称从fasta文件中提取数据（scaffold名称长）

001、(base) [sy20213040737@admin2 test]$ ls chr.list test.fa (base) [sy20213040737@admin2 test]$ cat test.fa ## 测试fasta文件 >chr1 xxxx aaaabbb cccccddd >chrx eee jj aaaaaabbbbbc cccccdddd >chr3 iii rr aaaaaaaaa aaaaaaaaa bbbbbbbb >c…

阅读更多...

SpringMVC-06-SSM整合

SpringMVC-06-SSM整合

1、环境要求IDEA MySQL 8.x Tomcat 9 Maven 3.6这只是大型软件要求，项目相关的jar包依赖将在Maven中配置。项目前置技能：MySQL、Mybatis、Spring、JavaWeb、简单的前端知识。 2、数据库表创建一个存放书籍数据的数据库表 CREATE DATABASE `ssmbuild`;USE `ssmbuild`;DROP T…

阅读更多...

高通sku lisence升级

高通sku lisence升级

最近在搞高通的license升级，也就是提速cpu/gpu性能，记录一下一、背景高通为了满足不同阶段开发需求，对soc性能做了一些特定定义，因此我们需要根据产品的开发阶段或者需求变化，使用对应的性能指标。不同license下的cpu gpu性能表现目前我们ES6代码默认使用的是CCCC对应的S…

阅读更多...

推荐文章

最新文章