第五节上，图像分类实战，食物分类

news/2025/3/6 16:28:42/文章来源:https://www.cnblogs.com/jyp02/p/18695933

随机种子固定随机结果,方便复现

def seed_everything(seed):torch.manual_seed(seed)torch.cuda.manual_seed(seed)torch.cuda.manual_seed_all(seed)torch.backends.cudnn.benchmark = Falsetorch.backends.cudnn.deterministic = Truerandom.seed(seed)np.random.seed(seed)os.environ['PYTHONHASHSEED'] = str(seed)

def read_file(self, path):if self.mode == "semi":file_list = os.listdir(path)xi = np.zeros((len(file_list), HW, HW, 3), dtype=np.uint8) #len(file_list)表示图像数量 dtype读成整型 RGB全为整数# 列出文件夹下所有文件名字for j, img_name in enumerate(file_list):img_path = os.path.join(path, img_name) #合并两个路径img = Image.open(img_path)img = img.resize((HW, HW))xi[j, ...] = imgprint("读到了%d个数据" % len(xi))return xielse:for i in tqdm(range(11)):file_dir = path + "/%02d" % ifile_list = os.listdir(file_dir)xi = np.zeros((len(file_list), HW, HW, 3), dtype=np.uint8)#读成整型yi = np.zeros(len(file_list), dtype=np.uint8)# 列出文件夹下所有文件名字for j, img_name in enumerate(file_list): #enumerate读下标和下标工具img_path = os.path.join(file_dir, img_name)img = Image.open(img_path)img = img.resize((HW, HW))xi[j, ...] = imgyi[j] = iif i == 0:X = xiY = yielse:X = np.concatenate((X, xi), axis=0)#将数组 X 和数组 xi 沿着第 0 个轴（通常代表样本数量这个维度）进行拼接Y = np.concatenate((Y, yi), axis=0)print("读到了%d个数据" % len(Y))return X, Y

tqdm显示循环进度条

train_transform = transforms.Compose([transforms.ToPILImage(),   #224， 224， 3模型  ：3, 224, 224transforms.RandomResizedCrop(224), #随机放大然后裁切transforms.RandomRotation(50), #旋转transforms.ToTensor() #模型用张量运行]
)

class food_Dataset(Dataset):def __init__(self, path, mode="train"):self.mode = modeif mode == "semi":self.X = self.read_file(path)else:self.X, self.Y = self.read_file(path)self.Y = torch.LongTensor(self.Y)  #标签转为长整形if mode == "train":#规定train和val不同的transform模式self.transform = train_transformelse:self.transform = val_transformdef __getitem__(self, item):if self.mode == "semi":return self.transform(self.X[item]), self.X[item]# 进行模型检测和加入数据集else:return self.transform(self.X[item]), self.Y[item]def __len__(self):return len(s

lr动态调整
W:权重衰减,让曲线更平滑

模型

class MyModel(nn.Module):                  #自己的模型def __init__(self,numclass = 2):super(MyModel, self).__init__()self.layer0 = nn.Sequential(nn.Conv2d(in_channels=3,out_channels=64,kernel_size=3,stride=1,padding=1,bias=True),nn.BatchNorm2d(64),nn.ReLU(inplace=True),nn.MaxPool2d(2))  #112*112self.layer1 = nn.Sequential(nn.Conv2d(in_channels=64,out_channels=128,kernel_size=3,stride=1,padding=1,bias=True),nn.BatchNorm2d(128),nn.ReLU(inplace=True),nn.MaxPool2d(2))  #56*56self.layer2 = nn.Sequential(nn.Conv2d(in_channels=128,out_channels=256,kernel_size=3,stride=1,padding=1,bias=True),nn.BatchNorm2d(256),nn.ReLU(inplace=True),nn.MaxPool2d(2))  #28*28self.layer3 = nn.Sequential(nn.Conv2d(in_channels=256,out_channels=512,kernel_size=3,stride=1,padding=1,bias=True),nn.BatchNorm2d(512),nn.ReLU(inplace=True),nn.MaxPool2d(2))  #14*14self.pool1 = nn.MaxPool2d(2)#7*7self.fc = nn.Linear(25088, 512)# self.drop = nn.Dropout(0.5)self.relu1 = nn.ReLU(inplace=True)self.fc2 = nn.Linear(512, numclass)def forward(self,x):x = self.layer0(x)x = self.layer1(x)x = self.layer2(x)x = self.layer3(x)x = self.pool1(x)x = x.view(x.size()[0],-1) #view 类似于reshape  这里指定了第一维度为batch大小，第二维度为适应的，即剩多少， 就是多少维。# 这里就是将特征展平。  展为 B*N  ，N为特征维度。4*512*512 ->4*25088x = self.fc(x)# x = self.drop(x)x = self.relu1(x)x = self.fc2(x)return x

model_name == "resnet18":""" Resnet18"""model_ft = models.resnet18(pretrained=use_pretrained) # 从网络下载模型  pretrain true 使用参数和架构， false 仅使用架构。set_parameter_requires_grad(model_ft, linear_prob)  # 是否为线性探测，线性探测： 固定特征提取器不训练。num_ftrs = model_ft.fc.in_features  #分类头的输入维度model_ft.fc = nn.Linear(num_ftrs, num_classes) # 删掉原来分类头， 更改最后一层为想要的分类数的分类头。input_size = 224

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/877475.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

对比使用DeepSeek与文新一言，了解DeepSeek的关键技术论文

DeepSeek是国内大模型技术的新秀，最近也在业界和媒体界火爆出圈，所以想学习一下其技术。大模型时代，学习知识，当然首先想到利用大模型，由于在过去一年，对DeepSeek使用不多，所以想和文新一言（4.0 Turbo）对比使用。通过对比，针对同一个问题“DeepSeek发扬开源文化，将…

Cisco NX-OS Software Release 10.5(2)F - 网络操作系统软件

Cisco NX-OS Software Release 10.5(2)F - 网络操作系统软件Cisco NX-OS Software Release 10.5(2)F - 网络操作系统软件 NX-OS 网络操作系统请访问原文链接：https://sysin.org/blog/cisco-nx-os-10/ 查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgCisco NX-OS…

pdf处理--tts（待重写）

1.提取正文2.裁剪页眉 https://smallpdf.com/cn/crop-pdf#r=crop-pages3.拆分4.ocr 效果图--白描：效果图--4Videosoft PDF Converter Ultimate：5.阅读器与tts引擎开源阅读：https://github.com/gedoor/legado tts-server-android：https://github.com/jing332/tts-server-an…

INFINI Labs 产品更新 | Console 发布 TopN 功能，Easysearch 新增 Rollup 能力等

INFINI Labs 产品全新发布！此次更新为大家带来了 Console 的全新 TopN 功能，让您能够更高效地定位最关键的节点或索引；Easysearch 新增 Rollup 能力，大幅提升监控指标的存储周期并优化分析体验；此外，Framework 还修复了多项缺陷并进行了多处优化。欢迎下载体验，探索更多…

03-一个例子

登录被测系统bysms双击运行runserver.bat 访问页面：http://127.0.0.1/mgr/sign.html 账号：byhy，密码：88888888 可以直接在pycharm的Terminal中运行hytest，不需要打开命令行窗口浏览器驱动的打印信息：禁止 chromedriver 日志写屏1 from selenium import webdriver 2 3 …

blog tips

markdown 内嵌 html 使图片并排点击查看代码 <div style="display: flex; gap: 10px; justify-content: space-between;"><img src="图片1地址" style="width: 49%; height: auto;"/><img src="图片2地址" style="…

【数学】已知正方形相邻两点坐标求另外两点坐标

已知正方形相邻两点(a,b)与(c,d)坐标公式： \( (x_3,y_3) = (c + (b-d), d - (a-c)) \\ (x_4,y_4) = (a + (b-d), b - (a-c)) \\ (x_5,y_5) = (a - (b-d), b + (a-c)) \\ (x_6,y_6) = (c - (b-d), d + (a-c)) \)

25.1.31小记

多态类型声明类型：定义时候的类型动态类型：运行到那里的时候对应的具体类型向上造型（cast）：将子类类型的对象赋给父类的变量（不能将一个父类的变量赋予一个子类的变量）赋值运算符：将管理者管理的对象进行改变（改变的是指针）其中造型（cast）的意义是将某…

MacOS修改应用快捷键的一般思路

具体步骤为：使用CheatSheet软件查看菜单项名称在系统设置中修改菜单项的快捷键举个例子：修改Chrome中左右切换tab的快捷键（系统语言为英文，中文同理）默认采用Ccontrol Tab和Control + Shift + Tab（或Command Shift [和Command Shift ]）可以左右切换tab。现在希望将其…

UE4.27, 模块实践, Slate的UI开发 (一)

1. 基本概念1.1. Slate是虚幻UI框架设计的底层，该框架中最基本的类是SWidget1.1.1.显然，我们容易注意到，直属于该框架的类拥有着指定的命名规则，即以S开头1.2. UMG, UWidget, Slate关联1.2.1. UMG:Unreal Motion Graphics UI Designer 虚幻的图形界面设计工具1.2.2. 单纯Sl…

Brainfly: 用 C# 类型系统构建 Brainfuck 编译器

Brainfly: 用 C# 类型系统构建 Brainfuck 编译器Brainfuck 简介 Brainfuck 是由 Urban Mller 在 1993 年创造的一门非常精简的图灵完备的编程语言。正所谓大道至简，这门编程语言简单到语法只有 8 个字符，每一个字符对应一个指令，用 C 语言来描述的话就是：字符含义> ++…

01-hytest简介

参考教程：http://vip3.byhy.net/auto/pyatframework/hytest-01/ 安装：pip3 install hytest hytest对应的python版本要求：Python3.6或者更高版本运行hytest自动化测试：打开命令行窗口切换到自动化代码根目录运行hytest，运行hytest其实就是运行python -m hytest.run 如果…

第五节上，图像分类实战，食物分类

随机种子固定随机结果,方便复现

模型

相关文章