目标检测笔记(十二):如何通过界面化操作YOLOv5完成数据集的自动标注

文章目录

  • 一、意义
  • 二、修改源码获取
  • 三、自动标注前期准备
  • 四、开始自动标注
  • 五、可视化标注效果
  • 六、XML转换TXT

一、意义

通过界面化操作YOLOv5完成数据集的自动标注的意义在于简化数据标注的流程,提高标注的效率和准确性。

传统的数据集标注通常需要手动绘制边界框或标记关键点,这个过程费时费力且容易出错。而通过界面化操作YOLOv5完成数据集的自动标注,可以实现自动识别目标并生成标注结果,极大地减轻了标注人员的工作负担。

界面化操作YOLOv5完成数据集的自动标注还可以提高标注的准确性。由于YOLOv5是一种基于深度学习的目标检测算法,其具有较高的检测准确率和鲁棒性。通过使用YOLOv5进行自动标注,可以减少人为因素对标注结果的影响,提高标注的一致性和准确性。

此外,界面化操作YOLOv5完成数据集的自动标注还可以加速标注的速度。YOLOv5可以快速地对图像进行目标检测,自动生成标注结果。相比于手动标注,自动标注可以大大减少标注的时间成本,提高数据集的制作效率。

总的来说,通过界面化操作YOLOv5完成数据集的自动标注可以简化标注流程、提高标注准确性和加速标注速度,对于大规模数据集的制作和实时应用具有重要意义。

二、修改源码获取

获取链接下载:点击

三、自动标注前期准备

  • annotions:里面为空,用于存放标注后的标签文件
  • coco128:通过下载coco128数据集并将其转换为YOLO可运行的文件夹
    • images
      • train2017:用于存放coco128的图片文件
    • labels
      • train2017:用于存放coco128的TXT标签文件
  • images:存放想要标注的图片文件
  • coco128.yaml:在这里插入图片描述
  • detector_classes.txt:用于存放想要打标签的类别信息在这里插入图片描述
  • yolov5s.pt: 官方下载的对应YOLOv5的权重文件,可根据自己实际情况进行更换
  • labels:用与存放将XML转换成TXT的文件

在这里插入图片描述

四、开始自动标注

第一步:下载修改后源码,通过Pycharm打开

第二步:通过Anaconda配置好YOLOv5的依赖环境

第三步:运行detect_auto.py在这里插入图片描述
第四步:选择好对应的文件路径,一步一步点击,选择好的界面如下在这里插入图片描述
第五步:点击开始自动标注,如果看到以下界面说明是没问题的在这里插入图片描述
第六步:检查对应标签文件在这里插入图片描述
在这里插入图片描述

五、可视化标注效果

第一步:通过cmd输入labelImg,打开标注界面
在这里插入图片描述
第二步:把TXT标注文件和拷贝到图像所在文件夹下,把classes.txt也拷过来.然后在labelimg里opendir,labelimg里显示看到当时标注的矩形框了在这里插入图片描述
在这里插入图片描述

六、XML转换TXT

将我们标注后的XML文件以及结合原图片,将其转换为可用于YOLO训练的TXT文件,后续可更方便调用数据集来进行训练。

修改两个路径:xml文件地址和创建保存txt文件的地址

import os
import xml.etree.ElementTree as ET# xml文件存放目录(修改成自己的文件名)
input_dir = r'E:\auto_label\annotation'# 输出txt文件目录(自己创建的文件夹)
out_dir = r'E:\auto_label\labels'class_list = []# 获取目录所有xml文件
def file_name(input_dir):F = []for root, dirs, files in os.walk(input_dir):for file in files:# print file.decode('gbk')    #文件名中有中文字符时转码if os.path.splitext(file)[1] == '.xml':t = os.path.splitext(file)[0]F.append(t)  # 将所有的文件名添加到L列表中return F  # 返回L列表# 获取所有分类
def get_class(filelist):for i in filelist:f_dir = input_dir + "\\" + i + ".xml"in_file = open(f_dir, encoding='UTF-8')filetree = ET.parse(in_file)in_file.close()root = filetree.getroot()for obj in root.iter('object'):cls = obj.find('name').textif cls not in class_list:class_list.append(cls)def ConverCoordinate(imgshape, bbox):# 将xml像素坐标转换为txt归一化后的坐标xmin, xmax, ymin, ymax = bboxwidth = imgshape[0]height = imgshape[1]dw = 1. / widthdh = 1. / heightx = (xmin + xmax) / 2.0y = (ymin + ymax) / 2.0w = xmax - xminh = ymax - ymin# 归一化x = x * dwy = y * dhw = w * dwh = h * dhreturn x, y, w, hdef readxml(i):f_dir = input_dir + "\\" + i + ".xml"txtresult = ''outfile = open(f_dir, encoding='UTF-8')filetree = ET.parse(outfile)outfile.close()root = filetree.getroot()# 获取图片大小size = root.find('size')width = int(size.find('width').text)height = int(size.find('height').text)imgshape = (width, height)# 转化为yolov5的格式for obj in root.findall('object'):# 获取类别名obj_name = obj.find('name').textobj_id = class_list.index(obj_name)# 获取每个obj的bbox框的左上和右下坐标bbox = obj.find('bndbox')xmin = float(bbox.find('xmin').text)xmax = float(bbox.find('xmax').text)ymin = float(bbox.find('ymin').text)ymax = float(bbox.find('ymax').text)bbox_coor = (xmin, xmax, ymin, ymax)x, y, w, h = ConverCoordinate(imgshape, bbox_coor)txt = '{} {} {} {} {}\n'.format(obj_id, x, y, w, h)txtresult = txtresult + txt# print(txtresult)f = open(out_dir + "\\" + i + ".txt", 'a')f.write(txtresult)f.close()# 获取文件夹下的所有文件
filelist = file_name(input_dir)# 获取所有分类
get_class(filelist)# 打印class
print(class_list)# xml转txt
for i in filelist:readxml(i)# 在out_dir下生成一个class文件
f = open(out_dir + "\\classes.txt", 'a')
classresult = ''
for i in class_list:classresult = classresult + i + "\n"
f.write(classresult)
f.close()

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/91465.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是数字孪生?

推荐:使用 NSDT场景编辑器 快速搭建3D应用场景 走进一家汽车装配厂。看到工人将螺母逐渐减少到螺栓上。听到气动工具的嗡嗡声。观看原始的车身沿着生产线滑行,机器人卷起零件。 现在,在线启动其 3D 数字孪生。看到动画数字人类在完全相同但数…

SVN 集中式版本管理平台

1. SVN 命令行工具下载地址 https://www.visualsvn.com/downloads/ 2. 下载SVN 命令行工具后,解压后就可以了,不需要安装的 3. 将bin 文件添加到系统环境变量中,不知道怎么打开系统环境变量的自己问度娘 4. 添加到系统环境变量中,…

TCP/UDP原理

文章目录 一、端口1. 端口的定义和作用2.服务端和客户端的区别3.常见的知名端口号有 二、TCP的原理1.TCP头部封装格式2.TCP可靠性机制三次握手确认机制四次挥手RST结束连接窗口机制 3.完整性校验4.TCP特征5.TCP的适用场景 三、UDP的原理1.UDP头部封装格式2.UDP特征3.UDP的适用场…

递归学习(转载)

转载至 https://www.cnblogs.com/king-lps/p/10748535.html 为避免原文丢失,因此原文转载作者【三年一梦】的帖子 前言 相信不少同学和我一样,在刚学完数据结构后开始刷算法题时,遇到递归的问题总是很头疼,而一看解答&#xff0c…

【C语言】循环语句详解

✨个人主页: Anmia.🎉所属专栏: C Language 🎃操作环境: Visual Studio 2019 版本 目录 1.什么是循环结构? 2.while循环 while流程图 while语句中的break和continue break continue 3.for循环 for流…

谷歌发布Gemini以5倍速击败GPT-4

在Covid疫情爆发之前,谷歌发布了MEENA模型,短时间内成为世界上最好的大型语言模型。谷歌发布的博客和论文非常可爱,因为它特别与OpenAI进行了比较。 相比于现有的最先进生成模型OpenAI GPT-2,MEENA的模型容量增加了1.7倍&#xf…

Chrome小恐龙快跑小游戏——Python实现

目录 视频演示 代码实现 视频演示 Chrome小恐龙快跑小游戏——Python实现 代码实现 import pygame import os import random pygame.init()# Global Constants SCREEN_HEIGHT 600 SCREEN_WIDTH 1100 game_over False SCREEN pygame.display.set_mode((SCREEN_WIDTH, SCR…

【QT】信号和槽(15)

前面的内容说了很多不同的控件如何使用,今天来看下QT的核心,信号与槽(Signals and slots)! 简单理解一下,就是我们的信号与槽连接上了之后,发射一个信号给到槽,槽函数接收到了这个信…

每日一题:leetcode 1267 统计参与通信的服务器

这里有一幅服务器分布图,服务器的位置标识在 m * n 的整数矩阵网格 grid 中,1 表示单元格上有服务器,0 表示没有。 如果两台服务器位于同一行或者同一列,我们就认为它们之间可以进行通信。 请你统计并返回能够与至少一台其他服务…

由于启动计算机时出现了页面文件配置问题,Windows在您的计算机创建了一个临时页面文件...

问题来源:D盘存储空间爆满以后,每次开机电脑开始自动弹窗。 提示信息: 可以点击确定,win10直接跳出虚拟内存设置窗口,如下 选择勾选“自动管理所有驱动器的分页文件大小”,点击确定,没有再弹窗。…

lnmp架构-PHP

08 PHP源码编译 09 php初始化配置 nginx 的并发能力强 phpinfo函数 就是 显示php信息 10 php的功能模块 编译memcache模块 php的动态模块方式 mamcache 就是内存 直接从内存中命中 所以性能非常好 但是 这还不是最好的方式 工作流程 关键看后端的 php 什么时候处理完 mamcac…

博客系统后端(项目系列2)

目录 前言 : 1.准备工作 1.1创建项目 1.2引入依赖 1.3创建必要的目录 2.数据库设计 2.1博客数据 2.2用户数据 3.封装数据库 3.1封装数据库的连接操作 3.2创建两个表对应的实体类 3.3封装一些必要的增删改查操作 4.前后端交互逻辑的实现 4.1博客列表页 …