RAC:无训练持续扩展,基于检索的目标检测器 | ECCV24

news/2024/11/8 9:32:03/文章来源:https://www.cnblogs.com/VincentLee/p/18534451

来源:晓飞的算法工程笔记 公众号,转载请注明出处

论文: Online Learning via Memory: Retrieval-Augmented Detector Adaptation

  • 论文地址:https://arxiv.org/abs/2409.10716

创新点


提出一种通过检索增强分类过程的创新在线学习框架RAC,与传统的基于离线训练/微调的方法相比,具有以下优点:

  1. 在线和持续学习能力。
  2. 最少的标注需求。
  3. 对视觉领域适应的计算无需求。

内容概述


目标检测器已经从闭集模型演变为开放世界模型,但将这些模型应用于新领域往往会导致较差的检测性能。为此,论文提出了一种新颖的方法,可以在线调整任何现成的目标检测模型,以适应新的领域,而无需重新训练检测器模型。

受到人类快速学习新主题(例如,记忆)方式的启发,论文允许检测器在测试时从记忆中查找相似的物体概念。这是通过一种检索增强分类(RAC)模块与一个可以灵活更新新领域知识的记忆库来实现的。

对各种现成的开放集检测器和闭集检测器进行了实验。仅使用一个小型记忆库(例如,每类10张图像)并且无需训练,RAC显著优于基线,在将检测器适应新的领域方面表现突出。

检索增强的检测器适应


在线学习框架由以下主要模块组成:

  1. 一个可在线更新的记忆库,其中包含用于提供在线适应新概念的目标领域图像
  2. 一个来自现成模型的物体(前景)提议模型,可以是开放世界检测器、在具有不同本体的相似领域数据上训练的任何检测器,或者简单的区域提议网络(RPN)。
  3. 一个上下文检索模块,用于将记忆库中的图像上下文与推理图像关联。
  4. 一个实例检索模块,用于将提议的物体实例与检索到的相似上下文中的实例关联。

对于查询图像,上下文级RAC首先从记忆库中选择相似的上下文图像。然后基于查询图像中的物体提议,对每个提议,实例级RAC在选定的相似上下文图像中执行实例匹配。最后,每个提议根据来自检索实例的投票分配一个类别。

物体(前景)提议模型

采用预训练的检测器作为物体提议网络,用于定位子任务,并专注于解决新概念分类子任务。

提议网络可以有多种形式,例如现成的开放集检测器、在不同数据集上训练的检测器(例如,具有不同本体的检测器),或者简单的区域提议网络(RPN),只要它能够提供有意义的前景提议。即使是没有任何语义能力的二元RPN网络,也可以使其具备分类能力。

记忆库

RAC仅需最少量的数据来构建记忆库,例如每个类别10张图像,这些图像可在在线学习环境中由最终用户轻松标注。为了构建一个高效的记忆库,论文提出了一种无监督的图像选择方法,利用图像级特征聚类来最大化覆盖率以及最小化标注工作。

  • 无监督种子图像聚类

使用强大的图像特征提取主干(例如CLIP)从未标注的目标域图像中提取嵌入,这些嵌入随后根据用户标注的图像数量进行聚类(例如,使用k-means),形成目标数量的聚类。每个聚类中的中心图像是由用户标注的,代表了多样化和具有代表性的场景。该方法能够通过每个类别仅标注10张图像就实现良好的检测性能。

检索增强(RAC)模块

通过在记忆库中存储标注的种子对象和图像,检索增强模块可以使物体检测器通过将目标检测到的提议与种子对象匹配来获得新的语义分类能力。

物体匹配的一个重大挑战是目标域中存在外观相似的不同类别的物体。为了解决这些混淆问题,论文构建了一个多阶段的上下文匹配过程。第一阶段,上下文检索,通过过滤掉无关场景(例如,过滤掉船只的海事场景)来缩小搜索范围。第二阶段,实例检索,则是在上下文匹配的图像中进行。通过同时考虑实例外观和上下文,该方法最大限度地减少了分类混淆并提高了检索准确性。

对于检索增强模型,强大的特征提取器是必要的。然而,它并不需要在目标域上进行训练即可实现良好的语义分类准确性。因此,任何强大的预训练特征提取器,例如DINOV2CLIP,都可以以无训练的方式使用,或者在提供的记忆库上进行微调以获得最佳性能。

具体来说,在第一阶段进行图像级语义匹配,使用现成的CLIP模型来提取图像级特征,然后计算查询图像与记忆库图像之间的相似性。在第二阶段进行实例级匹配,从图像级匹配结果中选择前 k 张图像(k=20, 50, 100),使用现成或微调的CLIP模型提取边界框级特征,然后计算实例之间的相似性选择的前 k 张图像。因此,最终的实例分类结果是边界框级匹配和全局上下文匹配的结合,有效地减少了外观引起的混淆。

主要实验




如果本文对你有帮助,麻烦点个赞或在看呗~
更多内容请关注 微信公众号【晓飞的算法工程笔记】

work-life balance.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/828693.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

信号量实现进程互斥、同步、前驱关系

信号量实现进程互斥、同步、前驱关系 ‍ ​​ ‍​​​ P、V 操作必须成对出现。缺少 P(mutex) 就不能保证临界资源的互斥访问。缺少 V(mutex) 会导致资源永不被释放,等待进程永不被唤醒。 ‍ 一、实现进程互斥 注:下图中的第一行对信号量的初始化只是简化写法,并不严格遵循…

Git推送报错Authentication failed

在某一次的Git推送中出现了一个奇怪的报错Authentication failed,经过一番测试有可能是VSCode的Git插件所导致的问题,本文提供了一个在VSCode的Terminal中可以正常push的解决方案。问题背景 在某一次的Git推送时,配置好commit信息之后,执行push操作的时候出现了这样的一个报…

iOS微信授权登录中Universal Link(通用链接)的配置

配置Unuversal Links 1.苹果开发者账号打开配置2.配置JSON文件,创建一个空白文件(必须纯文本,命名为apple-app-site-association,去除后缀名)。这里建议让后台人员在其本地创建,避免文件传输时,文件自动被更改格式、后缀自动添加等问题{"applinks": {"ap…

充电桩着火预警系统

充电桩着火预警系统利用现场监控摄像头,充电桩着火预警系统对新能源汽车充电场景进行7*24小时实时监测,自动发现监控区域范围内的异常烟雾和火灾事故苗头,大大减少了人为因素导致的误报和漏报现象。同时,系统还会自动记录报警信息和处理过程,为后续的故障排查和责任追溯提…

小区消防通道堵塞监测识别系统

小区消防通道堵塞监测识别系统利用现场监控摄像头对消防安全通道进行实时监测。小区消防通道堵塞监测识别系统通过先进的图像处理技术和深度学习算法,系统能够准确识别出消防通道是否被车辆、杂物等占据或阻塞。一旦监测到异常情况,系统会立刻发出告警信息,通过声光报警、短…

2个月搞定计算机二级C语言——真题(10)解析

1. 前言 本篇我们讲解2个月搞定计算机二级C语言——真题102. 程序填空题 2.1 题目要求2.2 提供的代码 #include <stdio.h> #pragma warning (disable:4996) double fun(double x[], int n) {int i, k = 0;double avg = 0.0, sum = 0.0;for (i = 0; i < n; i++)avg +…

我会卡常!

以下是博客签名,正文无关本文来自博客园,作者:ppllxx_9G,转载请注明原文链接:https://www.cnblogs.com/ppllxx-9G/p/18534410

考研打卡(11)

开局(11) 开始时间 2024-11-07 14:12:35 结束时间 2024-11-08 09:07:12上机ing数据结构下面关于图的存储的叙述中正确的是___(北京师范大学2015年) A 用邻接表法存储图,占用的存储空间大小只与图中边数有关,而与结点个数无关 B 用邻接表法存储图,占用的存储空间大小与图…

使用Kali进行Dos攻击实验

前言 1. 拒绝服务(DoS, Denial of Service)攻击是一种网络攻击手段,其目的是通过各种方式使目标系统或网络资源无法为合法用户提供正常服务。攻击者可能会利用网络协议的缺陷、发送大量无效请求或使用僵尸网络来耗尽目标系统的资源,如CPU、内存、带宽或网络连接,导致系统无…

PbootCMS提示会话目录写入权限不足

问题背景在使用 PbootCMS 时,可能会遇到“会话目录写入权限不足”的提示。这通常是由于某些目录的权限设置不正确导致的。解决方法通过设置 config、data、runtime 和 upload 等文件夹的可读写权限,可以解决这个问题。最简单的方法是将整个网站根目录设置为 777 权限。扫码添…

调度算法(一)

调度算法(一) (1)前言 此处列举的三种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。 因此这三种算法一般适合用于早期的批处理系统,当然, FCF…

PbootCMS 模板报错提示 PHP Warning: Unknown: open_basedir restriction ineffect. File

当你在使用 PbootCMS 时,如果遇到 PHP Warning: Unknown: open_basedir restriction ineffect. File 的错误提示,这通常是因为 PHP 的 open_basedir 配置限制了某些文件的访问权限。以下是解决该问题的方法: 1. 检查 PHP 版本 首先,确认你使用的 PHP 版本是否与 PbootCMS 兼…