先跑一跑Depth Anything

1. Depth Anything

24年1月开年王炸,论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“,来自香港大学、字节、浙江实验室和浙江大学。

Depth Anything,这是一种用于鲁棒单目深度估计的解决方案。目标是建立一个简单而强大的基础模型,在任何情况下处理任何图像。当然,项目也提供了用于Finetune的预训练模型。

2.先下载

大家可以先登录项目主页(https://depth-anything.github.io/),了解一下,先近距离感受Depth Anything的SOTA。

首先下载代码。

登录github(https://github.com/LiheYoung/Depth-Anything),clone相关项目代码。

项目代码相对简单,不做详细解读。

然后下载预训练模型。

登录Hugging face的发布页(https://huggingface.co/spaces/LiheYoung/Depth-Anything/tree/main),然后下载相关的checkpoints就可以了。

源代码和预训练模型可以从如下网盘中直接下载,源代码中run_sai.py按照如上进行了修改。

链接:https://pan.baidu.com/s/1pVHSyCztJ9dggtg9nHxxdw?pwd=1234

提取码:1234

3. 跑起来

如果只是想先跑起来,只需要修改一些代码就可以。原项目中,是通过DepthAnything.from_pretrained从线上下载,如下所示。

显然太麻烦了,因为我们已经下载的预训练模型,我们直接修改,从预训练模型直接构建。

第一步,修改模块导入,将from depth_anything.dpt import DepthAnything修改为from depth_anything.dpt import DPY_DINOv2。

第二步,从DPT_DINOv2直接构建。

如上,我们使用torch.load和load_state_dict直接构建了模型。

当然,你可能会遇到“No module named 'huggingface_hub'”的错误,只需按照如下安装即可。

pip3 install -U sentence-transformers

之后可以愉快的玩耍了。

附上几张Depth Anything在电力领域的深度估计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/460414.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

6、5 门关于 AI 和 ChatGPT 的免费课程,带您从 0-100

5 门关于 AI 和 ChatGPT 的免费课程,带您从 0-100 想在 2024 年免费了解有关 AI 和 ChatGPT 的更多信息吗? 图片由 DALLE 3 提供 活着是多么美好的时光啊。还有什么比现在更适合了解生成式人工智能(尤其是 ChatGPT)等人工智能元素的呢!许多人对这个行业感兴趣,但有些…

LeetCode Python - 3.无重复字符的最长子串

文章目录 题目答案运行结果 题目 给定一个字符串 s ,请你找出其中不含有重复字符的 最长子串 的长度。 示例 1: 输入: s “abcabcbb” 输出: 3 解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。 示例 2: 输入: s “bbbbb” 输出: 1 解释:…

MySQL之体系结构

华子目录 MySQL简介MySQL的特性MySQL版本MySQL常见版本 数据库排名网站MySQL结构体系查看最大连接数查询缓存配置情况 一条SQL语句执行流程 MySQL简介 MySQL是一个小型关系数据库管理系统,开发者为瑞典MySQL AB公司。在2008年1月16号被sun公司10亿美金收购。2009年…

UDP是什么,UDP协议及优缺点

UDP,全称 User Datagram Protocol,中文名称为用户数据报协议,主要用来支持那些需要在计算机之间传输数据的网络连接。 UDP 协议从问世至今已经被使用了很多年,虽然目前 UDP 协议的应用不如 TCP 协议广泛,但 UDP 依然是…

MySQL温故篇(一)SQL语句基础

一、SQL语句基础 数据库(SQL)思维导图_数据库设计思维导图-CSDN博客 1、SQL语言分类 DDL:数据定义语言 DCL:数据控制语言 DML:数据操作语言 DQL:数据的查询语言 2、数据类型 3、字符类型 char(11) &…

项目02《游戏-10-开发》Unity3D

【完成本集功能后共享1-10集整套代码】 基于 项目02《游戏-09-开发》Unity3D , 任务:传送至其他场景, 首先在场景中加入传送门, 设置人物标签, using UnityEngine; using UnityEngine.SceneManagement; u…

【新书推荐】7.1节 立即寻址方式

本节内容:立即寻址方式的操作数包含在指令中,作为指令的一部分,跟在操作码后存放在代码段。这种操作数称为立即数。 ■立即寻址方式的实现:8086计算机中,立即数可以是8位,也可以是16位。按照高高低低的原则…

MedSAM in 3D Slicer: 分割一切医学图像

MedSAM-Lite 3D Slicer简介 这是 MedSAM 的官方 3D Slicer 插件存储库,可用于在医学图像中分割任何物体。 什么是MedSAM:点击查看这篇文章 SCI 1区论文:Segment anything in medical images 查看分割演示👇 添加视频 文中涉及到的视频前往…

工厂方法模式(Factory Method Pattern)

原文地址:https://jaune162.blog/design-pattern/factory-method-pattern/ 概述 工厂方法模式(Factory Method Pattern)是一个对象创建型模式。 定义一个用于创建对象的接口,让子类决定实例化哪一个类。 Factory Method使一个类的实例化延迟到其子类。 – 《设计模式:可复…

手动汉化unity编辑器,解决下载中文语言报错问题

手动汉化unity编辑器,解决下载中文语言报错问题 START 最近在下载支持微信小程序版本的编辑器时,中文语言包,一直无法下载。记录一下 手动汉化unity编辑器的方法 ,帮助和我遇到同样问题的人。 解决方案 1. 下载汉化包 https:…

jvm几个常见面试题整理

1. Full GC触发机制有如下5种情况。 (1)调用System.gc()时,系统建议执行Full GC,但是不必然执行。(2)老年代空间不足。(3)方法区空间不足。(4)老年代的最大可用连续空间小于历次晋升到老年代对象的平均大小就会进行Full GC。(5)由Eden区、S0(From)区向S…

元宇宙虚拟数字人实训室:推动高校培养创新技术人才

随着元宇宙时代的到来,虚拟数字人技术逐渐成为当下火热的产业赛道之一。虚拟数字人涉及了计算机、数字媒体、市场营销等学科技术领域,高校可以通过搭建元宇宙虚拟数字人实训室,有效培养对元宇宙行业的专业化理解和研究能力的专业型创新人才。…