【深度学习】yolo-World,数据标注,zeroshot,目标检测

仓库:https://github.com/AILab-CVC/YOLO-World

下载权重:
在这里插入图片描述

仓库下载和环境设置

  1. 下载仓库:使用以下命令从 GitHub 上克隆仓库:
git clone --recursive https://github.com/AILab-CVC/YOLO-World.git
  1. 创建并激活环境:首先,创建一个名为 yoloword1 的 Conda 环境,并激活它:
conda create -n yoloword1 python=3.8 -y
conda activate yoloword1

安装依赖项

  1. 安装 PyTorch 和 Gradio:使用以下命令安装 PyTorch 和 Gradio:
pip install torch wheel gradio==4.16.0
  1. 安装 YOLO-World 包:进入项目目录并使用 -e 参数来安装可编辑模式下的 YOLO-World 包:
cd YOLO-World/
pip install -e .

运行示例

  1. 运行示例代码:使用以下命令运行示例代码。确保你提供了正确的路径和参数:
python image_demo.py ./configs/pretrain/yolo_world_v2_l_clip_large_vlpan_bn_2e-3_100e_4x8gpus_obj365v1_goldg_train_800ft_lvis_minival.py /data/xiedong/yolo_world/yolo_world_v2_l_clip_large_o365v1_goldg_pretrain_800ft-9df82e55.pth /data/xiedong/yolo_world/testtmp 'fire,smoke' --topk 2 --threshold 0.01 --output-dir /data/xiedong/yolo_world/testtmpdemo_outputs

标注效果展示

标注效果:

在这里插入图片描述

下载请看这里:

https://docs.qq.com/sheet/DUEdqZ2lmbmR6UVdU?tab=BB08J2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/641430.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软Azure AI服务中的Speech Studio:实现自动语音识别ASR与高效AI字幕生成

一、自动语音识别(ASR)和Speech是什么? 小爱同学、 Siri 、豆包的电话功能、微信的”文字语音转文字”,百度网盘的AI字幕,小度智能音箱、小米SU7等智能汽车的语音控制的功能都用到自动语音识别ASR,相当于A…

# MySQL中的并发控制,读写锁,和锁的粒度

MySQL中的并发控制,读写锁,和锁的粒度 并发控制的概述 在数据库系统中,并发控制是一种用于确保当多个用户同时访问数据库时,系统能够提供数据的一致性和隔离性的机制。MySQL支持多种并发控制技术,其中包括锁机制、多…

虚拟化+Docker基本管理

一、虚拟化简介 1、云端 华为云、谷歌云、腾讯云、阿里云、亚马逊、百度云、移动云、天翼云、西部数码云等 1.国内云 华为云、阿里云、腾讯云、天翼云(私有云) 2.国外云 谷歌云、亚马逊 2、云计算的服务模式是分层的 IaaS:Infrastructure(基础设…

VUE3发布到IIS跳转页面报404以及刷新报404解决

1、安装URL重写,自行百度。 2、名称随意,匹配URL里左侧的与模式匹配我没有动,右侧我用的通配符,网上有的用的正则。模式我用的*,网上有人用的.* 3、条件要自己展开,一开始没有左侧框里的那2条,…

备考2024年上海初中生古诗文大会:单选题真题示例和独家解析

上海市中小学生的初中生古诗文大会——即上海中学生古诗文大会(初中组)和小学生古诗文大会(比赛)相比,除了题型更丰富之外,最主要的是考察的内容深度和广度不同。初中的题目中对于文言文的考察大幅增加&…

高中数学:三角函数之考点精华-单调性问题

一、解题方法 1、换元 2、画图 3、反向求解 参考:整体换元法 二、练习 例题1 解析: 这一题,比较简单,是标准的换元法应用题。 这里稍微注意下第二小问的对称中心,因为,B1,所以,对…

山海鲸大屏:驱动医药零售智能化变革

在数字化浪潮席卷全球的今天,医药零售行业也正以前所未有的速度与力度进行智能化转型。其中,山海鲸智慧医药零售大屏以其创新的设计理念、强大的功能集成与卓越的数据处理能力,成为推动医药零售迈向智能化、精准化的新引擎。本文将全方位解读…

呵护明亮视界:儿童戴眼镜的正确姿势与注意事项

引言: 随着近视率的不断上升,越来越多的儿童需要佩戴眼镜来矫正视力问题。然而,儿童的视觉系统尚未完全发育成熟,因此他们佩戴眼镜时需要特别的关注和呵护。本文将探讨儿童戴眼镜的正确姿势与注意事项,旨在为家长和孩子…

SQLite FTS5 扩展(三十)

返回:SQLite—系列文章目录 上一篇:SQLite的知名用户(二十九) 下一篇:SQLite 的命令行 Shell(三十一) 1. FTS5概述 FTS5 是一个 SQLite 虚拟表模块,它为数据库应用程序提供全文搜索功能。在最基本的形式中, 全文搜索引擎允许…

ubuntu22.04 CH340/CH34x 驱动安装

CH34x驱动地址:CH341SER_LINUX.ZIP - 南京沁恒微电子股份有限公司 1、卸载旧驱动(如果存在) sudo rmmod ch341.ko 2、解压进入 driver 目录 unzip CH341SER_LINUX.ZIP cd CH341SER_LINUX/driver 3、编译 make 可能错误: make[1]…

端口被占用的解决方案汇总

端口被占用的解决方案汇总 【一】windows系统端口被占用【二】Linux系统端口被占用【三】Linux的ps命令查找(1)ps命令常用的方式有三种(2)ps -ef |grep 8080 【一】windows系统端口被占用 (1)键盘上按住Wi…

AI大模型实现软件智能化落地实践

1、什么是大模型 大型语言模型(Large Language Model,LLM;Large Language Models,LLMs)。 大语言模型是一种深度学习模型,特别是属于自然语言处理(NLP)的领域,一般是指包含数干亿&…