CVPR 2024 - Retrieval-Augmented Open-Vocabulary Object Detection

news/2025/3/29 22:21:48/文章来源:https://www.cnblogs.com/lart/p/18794789
  • Author: lartpang
  • Link: https://github.com/lartpang/blog/issues/13

CVPR 2024 - Retrieval-Augmented Open-Vocabulary Object Detection

  • 论文:https://arxiv.org/abs/2404.05687
  • 代码:https://github.com/mlvlab/RALF

本文提出了一种新的开放词汇目标检测方法 Retrieval-Augmented Losses and visual Features (RALF)。RALF 通过从大型词汇库中检索词汇并增强损失函数和视觉特征来提高检测器对新类别的泛化能力。

该方法由两个部分组成:检索增强损失(RAL)和检索增强视觉特征(RAF)。

RAL RAF
image image
  • RAL 通过使用与负词汇库的语义相似性的距离来优化嵌入空间。通过从大型词汇库中,按照语义相似性检索与真实类别标签相关的难负词汇和易负词汇。然后,RAL 使用这些词汇和真实框嵌入来定义难负损失和易负损失。
  • RAF 则利用大型语言模型(LLM)生成关于大型词汇库的描述,并从中提取有关目标的详细信息,以增强视觉特征。RAF 首先在离线阶段从目标提案中生成视觉特征。然后,在推理阶段,RAF 使用概念检索器和增强器从概念存储库中检索相关概念,并使用这些概念来增强视觉特征。

通过实验,作者证明了 RALF 在 COCO 和 LVIS 基准数据集上的有效性。特别是在 COCO 数据集的新类别上,APN50 提高了 3.4%,在 LVIS 数据集的新类别上,mask APr 提高了 3.6%。 未命名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/906359.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3.26 学习记录

实现了学习记录APP每日总结的功能,可以实现每日总结的增删改查,点击题目可以查看详情跳转博客园

Django 之 ContentType(django_content_type)

REF https://blog.csdn.net/weixin_30498807/article/details/96845973 https://blog.csdn.net/aaronthon/article/details/81714496用来管理和维护我们应用程序的models转自:https://www.cnblogs.com/oysq/p/15643370.htmlDjango除了我们常见的admin、auth、session等contrib…

20243402谢子凌 实验二《Python程序设计》实验报告

学号 2024-2025-2 《Python程序设计》实验二报告 课程:《Python程序设计》 班级: 2434 姓名: 谢子凌 学号:20243402 实验教师:王志强老师 实验日期:2025年3月26日 必修/选修: 公选课 1.实验内容 设计并完成一个完整的应用程序,完成加减乘除模等运算,功能多多益善。 考…

【视频】文本挖掘专题:Python、R用LSTM情感语义分析实例合集|上市银行年报、微博评论、红楼梦数据、汽车口碑数据采集词云可视化

原文链接:https://tecdat.cn/?p=41149原文出处:拓端数据部落公众号 分析师:Zhenzhen Liu,Shuai FungPython企业年报文本分析情感挖掘语调分析:以上市银行为例作为数据科学家,我们始终关注如何从非结构化数据中提取高价值信息。本专题合集聚焦企业年报的文本分析技术,通…

20242125 单嘉怡 实验二《Python程序设计》实验报告

20242125单嘉怡 2024-2025-2 《Python程序设计》实验二报告 课程:《Python程序设计》 班级:2421 姓名:单嘉怡 学号:20232401 实验教师:王志强 实验日期:2025年3月26日 必修/选修: 公选课 一.实验内容设计并完成一个完整的应用程序,完成加减乘除模等运算,功能多多益善。…

026 登录页-手机登录搭建-volar警告消除

这里什么也不写,把res删除 2、这样写 3、看看效果

20243116 实验二《Python程序设计》实验报告

20243116 2024-2025-2 《Python程序设计》实验二报告 课程:《Python程序设计》 班级: 2431 姓名: 陆翔轩 学号:20243116 实验教师:王志强 实验日期:2025年3月26日 必修/选修: 公选课 一、实验内容 1.设计并完成一个完整的应用程序,完成加减乘除模等运算,功能多多益善。…

基于Grafana使用官方模版查询Prometheus数据

grafana配置Prometheus作为数据源选择一个模版,导入到dashboards 模板地址 https://grafana.com/grafana/dashboards/ 选择Prometheus,选择一个适应版本的模版,记录ID 例如:1860 11074 8919查看dashboards