clothing1m数据集使用-编程知识

clothing1m数据集使用

news/2024/10/6 6:01:49/文章来源:https://www.cnblogs.com/zh-jp/p/18442951

简介

Clothing1M 包含 14 个类别的 100 万张服装图像。这是一个带有噪声标签的数据集，因为数据是从多个在线购物网站收集的，并且包含许多错误标记的样本。该数据集还分别包含 50k、14k 和 10k 张带有干净标签的图像，用于训练、验证和测试。

下载地址：https://github.com/Newbeeer/L_DMI/issues/8

Dataset & DataLoader

数据集目录结构：

└─images├─0│  ├─00│  ├─...│  └─99├─...└─9├─00├─...└─99

import osfrom PIL import Image
from torch.utils.data import Dataset, DataLoader
from torchvision.transforms import transforms# mode=0: noisy train set, mode=1: clean val set, mode=2: clean test set
class Clothing1m(Dataset):nb_classes = 14def __init__(self, mode=0, root='~/data/clothing1m', transform=None):root = os.path.expanduser(root)self.mode = modeself.root = rootself.transform = transformif mode == 0:txt_file = 'noisy_label_kv.txt'else:txt_file = 'clean_label_kv.txt'with open(os.path.join(root, txt_file), 'r') as f:lines = f.read().splitlines()self.labels = {line.split()[0]: int(line.split()[1]) for line in lines}data_path = []txt_file = ['noisy_train_key_list.txt', 'clean_val_key_list.txt', 'clean_test_key_list.txt']if mode in [0, 1, 2]:with open(os.path.join(root, txt_file[mode]), 'r') as f:lines = f.read().splitlines()for line in lines:data_path.append(line)else:raise ValueError('mode should be 0, 1 or 2')self.data = data_pathself.targets = [self.labels[img_path] for img_path in data_path]def __len__(self):return len(self.targets)def __getitem__(self, index):img_path = self.data[index]targets = self.labels[img_path]image = Image.open(os.path.join(self.root, img_path)).convert('RGB')image = self.transform(image)if self.mode == 0:return image, targets, indexreturn image, targetsclass Clothing1mDataloader:def __init__(self, batch_size=64, num_workers=8, root='~/data/clothing1m'):self.batch_size = batch_sizeself.num_workers = num_workersself.root = rootself.transform_train = transforms.Compose([transforms.Resize(256),transforms.RandomCrop(224),transforms.RandomHorizontalFlip(),transforms.ToTensor(),transforms.Normalize((0.6959, 0.6537, 0.6371), (0.3113, 0.3192, 0.3214)),])self.transform_test = transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize((0.6959, 0.6537, 0.6371), (0.3113, 0.3192, 0.3214)),])def train(self):transform = self.transform_traindataset = Clothing1m(mode=0, root=self.root, transform=transform)dataloader = DataLoader(dataset, batch_size=self.batch_size, shuffle=True,num_workers=self.num_workers, pin_memory=True)return dataloaderdef val(self):dataset = Clothing1m(mode=1, root=self.root, transform=self.transform_test)dataloader = DataLoader(dataset, batch_size=self.batch_size, shuffle=False,num_workers=self.num_workers, pin_memory=True)return dataloaderdef test(self):dataset = Clothing1m(mode=2, root=self.root, transform=self.transform_test)dataloader = DataLoader(dataset, batch_size=self.batch_size, shuffle=False,num_workers=self.num_workers, pin_memory=True)return dataloader

依赖

torch                              2.3.1

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/806637.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

clothing1m数据集使用

简介

Dataset & DataLoader

依赖

相关文章

windows10如何安装jdk8，并且配置java home环境？超详细！

安装小雅问题

leetcode24 两两交换链表中的节点(swap-nodes-in-pairs)

第一章:Borel测度

TypeScript在vue中的使用-----事件类型的获取

信息学奥赛复赛复习08-CSP-J2020-03表达式前置知识点-后缀表达式、栈、字符读取

IDEA如何查看已经安装的插件并删除

python中列表和字符串的相互转换

Cookie,Session与Token

A. 2025--[炼石计划--NOIP模拟三]--T1--矩形

深度学习（UNet）

【防忘笔记】测试过程与技术