DINOv2

news/2024/12/13 20:23:06/文章来源:https://www.cnblogs.com/owlowl/p/18605782

(一)data processing

1.1 去重

最开始精选数据集(curated data)+未整理数据池(uncurated data)包含1.2B张图像

copy detection pipeline - "A Self-Supervised Descriptor for Image Copy Detection" 简称方法SSCD,是基于SimCLR的改进

使用SSCD方法对图片抽取embedding,然后进行K-NN聚类(K=64),只保留其中一张 =》744M

2.1 检索

sample based similarity

以数据集中的每个图片为query,选取超过阈值的与之最相似的k个(k=4和32)uncurated的图片

cluster based simlarity

将未整理的数据聚类成不同的群组,并从每个群组中抽样10,000张图像,然后丢弃其余部分。

最终LVD-142M

(二)training

2.1 image-level objective

student 模型输出的embedding和teacher 模型输出的embedding之间的cross entropy loss

2.2 patch-level objective(来自iBot)

cross-view tokens loss + masked image modelling loss(重建被masked的patch损失)

2.3 Koleo regularization

2.4 518*518

 

 

https://blog.csdn.net/qq_51659249/article/details/142699887

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/852076.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

子查询与嵌套查询

title: 子查询与嵌套查询 date: 2024/12/13 updated: 2024/12/13 author: cmdragon excerpt: 子查询和嵌套查询是关系型数据库中强大的查询工具,允许用户在一个查询的结果中再进行查询。通过使用子查询,用户能够简化复杂的SQL语句,增强查询的灵活性和可读性。本节将探讨子…

JS-14 条件语句之switch

多个if...else连接在一起使用的时候,可以转为使用更方便的switch结构 表达式→值1→语块1→break;→ 表达式→值2→语块1→break;→ 表达式→defalut→默认语块→ switch(fruit){case"banana"://...break;case"apple"://...default://... }需要注意的是…

深入解析 Transformers 框架(五):嵌入(Embedding)机制和 Word2Vec 词嵌入模型实战

本文深入探讨了 Transformers 框架中词嵌入(Token Embeddings)的关键作用和实现细节,展示了将离散符号映射至连续向量空间的过程。通过具体代码示例,我们揭示了 Qwen2.5-1.5B 大模型中嵌入矩阵的工作原理,并演示了如何将文本序列转换为嵌入向量。此外,文章还介绍了经典的…

如何更换业务服务jar包中依赖的第三方jar的版本

1.解压业务服务jar包,比如叫gank-api-0.0.1-SNAPSHOT.jarjar -xvf gank-api-0.0.1-SNAPSHOT.jar 2.在解压后的META-INF目录下找到pom.xml,更新为新版本号 3.在BOOT-INFO中找到要替换的jar,用新版本jar进行替换4.回到当前目录,重新打包 注意:jar -cfM0 gank-api-0.0.1-SNAP…

C#调用Python脚本的方式(一),以PaddleOCR-GUI为例

前言 每种语言都有每种语言的优势,Python由于其强大的生态,很多任务通过调用包就可以实现,那么学会从C#项目中调用Python脚本完成任务就很重要。C#调用Python代码有多种方式,如果Python那边内容比较多,可以考虑起一个Web Api进行调用,如果只是一个简单的脚本而且不需要频…

sFlow虚拟机流量监控

实验-sFlow流量监控 本实验需要准备两个虚拟机:Mininet虚拟机:需要安装Mininet,用来创建topo产生流量。 sFlow虚拟机:需要安装sFlow,用来监控Mininet虚拟机中的topo中产生的流量。实验基本流程介绍:准备两台Ubuntu虚拟机,一台安装Mininet,一台安装sFlow 在Mininet虚拟机…

八、ArkTS-语句-类型进阶与渲染控制

1.对象数组 1.1定义对象数组 它是一个自定义对象类型的数组,数组元素是自己定义对象类型的对象,就是数组元素是对象,数组类型是自定义对象的类型//第一步通过接口定义对象 interface student{stuID:number,name:string,gender:string,age:number }//基于接口创建对象数组 le…

在CodeBolcks+Windows API下的C++编程教程——给你的项目中添加资源文件和图标

0.前言 我想通过编写一个完整的游戏程序方式引导读者体验程序设计的全过程。我将采用多种方式编写具有相同效果的应用程序,并通过不同方式形成的代码和实现方法的对比来理解程序开发更深层的知识。 了解我编写教程的思路,请参阅体现我最初想法的那篇文章中的“1.编程计划”:…

20222402 2024-2025-2 《网络与系统攻防技术》实验七实验报告

1.实验内容 1.1本周学习内容 网络攻击基本模式 ①截获 嗅探 监听 ②篡改 数据包篡改 ③中断 拒绝服务 ④伪造 欺骗 IP 源地址欺骗: 伪造具有虚假源地址的 IP 数据包进行发送√目的:隐藏攻击者身份、假冒其他计算机通过身份验证 1.2实验内容及要求 本实践的目标理解常用网络欺诈…

转载:【AI系统】LLVM IR 基本概念

在上一篇文章中,我们已经简要介绍了 LLVM 的基本概念和架构,我们现在将更深入地研究 LLVM 的 IR(中间表示)的概念。 了解 LLVM IR 的重要性是为了能够更好地理解编译器的运作原理,以及在编译过程中 IR 是如何被使用的。LLVM IR 提供了一种抽象程度适中的表示形式,同时能够…

转载:【AI系统】AI 框架基础介绍

什么是 AI 算法?什么是神经网络?神经网络有什么用?为什么神经网络需要训练?什么是模型?AI 框架有什么用?AI 框架能解决什么问题? 上面的几个问题其实还挺有挑战的,也是本文需要回答的一个问题。下面来对一些基础概念进程澄清:首先深度学习是机器学习研究领域中的一种范…