划分数据集，训练自己的数据集。-编程知识

划分数据集，训练自己的数据集。

news/2025/2/19 6:06:22/文章来源:https://blog.csdn.net/weixin_53035684/article/details/138038441

数据集划分是跟着up主魔傀面具做的，很好用很方便，推荐给大家，顺便做个例子讲一下怎么使用

把自己的图片数据集放在dataset/VOCdevkit/JPEGImages里面，看看自己的数据集格式，是JPEG还是png格式的还是其他。

然后就是把标注的文件放在dataset/VOCdevkit/Annotations，如果你的格式是xml格式

如果是txt格式的话，放在dataset/VOCdevkit/txt

标注文件的格式看的方法

看我的文件后缀就是.xml

或者打开属性

图片格式的查看也类似

我用一些数据来做个例子，我的数据集是100张，格式是JPG，标注文件是xml格式的

点击右键，不管是用pycharm还是vscode都可以

我用vscode为例子

如果是xml格式的标注文件，先运行xml2txt.py文件

在这之前，先配好自己的环境

vscode配置anaconda环境-CSDN博客

设置自己图片的格式，我的是jpg

在vscode上方打开终端

先进入的dataset文件夹里

输入

cd dataset

最新一行的最后面是dataset，就说明进入dataset文件夹了

输入

python xml2txt.py

这就是转换好了，下面出现的的是类别的名字，把这个复制到data.yaml里面

接着是划分数据集，点开split_data.py

我的图片格式是jpg，自己看自己的格式是什么

这是划分的比例，一般来说都是8:1:1，这个就不用动了

如果想划分成别的也可以，val_size是验证集占的比例，test_size是测试集占的比例，看你想设置多少，也可以设置为0

接着就是在终端输入

python split_data.py

回车就可以了

这是我划分的结果，按照8:1:1分的，结果在dataset文件夹下又image和labels两个文件夹里放着，里面都是对应着放的

终端操作教程，前提是你的python文件都已经设置好了

按住shift加右键点击dataset文件

先选择自己的环境

这里不会的看我的其他文章，里面有介绍使用的

conda activate 自己环境的名字

如果自己的数据集格式是txt的直接运行

python split_data.py

自己的数据集是xml格式的，先运行

python xml2txt.py

然后再运行

python split_data.py

这时候我的标注文件已经转换过txt了，这是我的运行结果

最后附上去代码链接

链接：https://pan.baidu.com/s/1wBYbKemcK67nVxmtSPundQ?pwd=0pdc
提取码：0pdc
--来自百度网盘超级会员V2的分享

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/638309.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Oracle中的视图

Oracle中的视图

1- 什么是视图视图是一个虚拟表视图是由sql查询语句产生的视图真实存在但是不存储数据视图中的数据只是对基表(源数据表) 中的数据的引用总的来说视图可以简化数据用户，订单，物流三个表进行关联吧很复杂的sql查询语句存储成一个视图 …

阅读更多...

狗都不学系列——虚拟机的基本使用

狗都不学系列——虚拟机的基本使用

前言虚拟机（Virtual Machine）指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。在实体计算机中能够完成的工作在虚拟机中都能够实现。简单来讲就是我们可以通过虚拟机来安装各种不同的操作系统进行体验。这次主…

阅读更多...

【Flutter】多语言方案一：flutter_localizations 与 GetX 配合版

【Flutter】多语言方案一：flutter_localizations 与 GetX 配合版

介绍多语言方案：flutter_localizations 与 GetX 配合版，好处：命令行生成多语言字符串的引用常量类，缺点：切换语言以后，主界面需要手动触发setState，重绘将最新的Locale数据设置给GetMaterialA…

阅读更多...

指针的使用以及运算、二级指针、造成野指针的原因以及解决方法、指针和数组相互使用

指针的使用以及运算、二级指针、造成野指针的原因以及解决方法、指针和数组相互使用

第七章，指针的学习目录前言一、指针的概念二、指针的类型三、野指针四、指针的运算五、指针和数组的关系以及使用六、指针数组七、二级指针总结前言这章主要学习的是指针方面的知识，这节只是简单了解一下指针，并不会深…

阅读更多...

卷积神经网络（CNN）基础

卷积神经网络（CNN）基础

目录卷积神经网络介绍卷积神经网络原理卷积层：通过在原始图片上平移来提取特征激活层：增加非线性分割能力池化层polling（下采样层）：减少学习参数，去掉不重要的样本，降低网络的复杂度卷…

阅读更多...

java多线程-并发和并行

java多线程-并发和并行

进程并发进程中的线程是由CPU进行调度的，但是CPU能够处理的进程数量有限为了保证所有的线程都在运行，CPU会快速切换，给外界的感觉就是所有的线程都在运行，这就是并发。并行

阅读更多...

钟薛高创始人称卖红薯也把债还上：网友，您可千万别……

钟薛高创始人称卖红薯也把债还上：网友，您可千万别……

网红雪糕品牌钟薛高，是真的网红属性强到让所有消费品牌羡慕。纵使跌落神坛、纵使站在「破产」边缘，依然话题感满满，隔段时间，总能上一个热搜。比如欠薪上热搜、产品降价上热搜、甚至官网微博微信停更，也得上个热搜&…

阅读更多...

【数学建模】虫子追击问题（仿真）

【数学建模】虫子追击问题（仿真）

已知有四个虫子,分别是 A , B , C , D A,B,C,D A,B,C,D A , B , C , D A,B,C,D A,B,C,D分别在 ( 0 , 0 ) , ( 0 , 1 ) , ( 1 , 1 ) , ( 1 , 0 ) (0,0),(0,1),(1,1),(1,0) (0,0),(0,1),(1,1),(1,0)四个虫子A追B，B追C，C追D，D追A四个速度相同 …

阅读更多...

《计算思维导论》笔记：《第10章数据化思维-数据聚集与管理》计算思维第17讲-从表的管理看数据库

《计算思维导论》笔记：《第10章数据化思维-数据聚集与管理》计算思维第17讲-从表的管理看数据库

《大学计算机—计算思维导论》（战德臣哈尔滨工业大学） 《计算思维第17讲-从表的管理看数据库----结构化与非结构化数据管理》一、引言今天我们从表的管理看数据库，给大家讲一下结构化与非结构化数据管理的思维。二、为什么需要数据库–工…

阅读更多...

机器学习（二）之监督学习

机器学习（二）之监督学习

前言： 上一节大概讲解了几种学习方式，下面几张就具体来讲讲监督学习的几种算法。以下示例中和都是权重的意思！！！ 注：本文如有错误之处，还请读者指出，欢迎评论区探讨！ 1…

阅读更多...

Matlab进阶绘图第51期—带填充等高线的三维特征渲染散点图

Matlab进阶绘图第51期—带填充等高线的三维特征渲染散点图

带填充等高线的三维特征渲染散点图是填充等高线图与特征渲染三维散点图的组合。其中，填充等高线图与特征渲染的三维散点图的颜色用于表示同一个特征。由于填充等高线图无遮挡但不直观，特征渲染的三维散点图直观但有遮挡，而将二者组合&…

阅读更多...

Python | Leetcode Python题解之第44题通配符匹配

Python | Leetcode Python题解之第44题通配符匹配

题目： 题解： class Solution:def isMatch(self, s: str, p: str) -> bool:def allStars(st: str, left: int, right: int) -> bool:return all(st[i] * for i in range(left, right))def charMatch(u: str, v: str) -> bool:return u v or v…

阅读更多...

推荐文章

最新文章