b站小土堆pytorch学习记录—— P27-P29 完整的模型训练套路

文章目录

  • 一、定义模型(放在model.py文件中)
  • 二、训练
  • 三、测试
  • 四、完整的训练和测试代码

一、定义模型(放在model.py文件中)

import torch
from torch import nnclass Guodong(nn.Module):def __init__(self):super(Guodong,self).__init__()self.module = nn.Sequential(nn.Conv2d(3, 32, 5, 1, 2),nn.MaxPool2d(2),nn.Conv2d(32, 32, 5, 1, 2),nn.MaxPool2d(2),nn.Conv2d(32, 64, 5, 1, 2),nn.MaxPool2d(2),nn.Flatten(),nn.Linear(64*4*4, 64),nn.Linear(64, 10))def forward(self, x):x = self.module(x)return xif __name__ == '__main__':guodong = Guodong()input = torch.ones((64, 3, 32, 32))output = guodong(input)print(output.shape)

二、训练

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from model import *dataset_train = torchvision.datasets.CIFAR10("dataset1", train=True, transform=torchvision.transforms.ToTensor(), download=True)
dataset_test = torchvision.datasets.CIFAR10("dataset1", train=False, transform=torchvision.transforms.ToTensor(),download=False)dataset_train_size = len(dataset_train)
dataset_test_size = len(dataset_test)
print("训练集的数据长度为{}".format(dataset_train_size))
print("测试集的数据长度为{}".format(dataset_test_size))train_dataloader = DataLoader(dataset_train, batch_size=64)
test_dataloader = DataLoader(dataset_test, batch_size=64)# 创建网络模型
guodong = Guodong()# 损失函数
loss_fn = nn.CrossEntropyLoss()# 优化器
learning_rate = 1e-2
optimizer = torch.optim.SGD(guodong.parameters(), learning_rate)# 设置训练网络的一些参数
total_train_step =0
total_test_step = 0
epoch = 10for i in range(10):print("------第{}次训练开始------".format(i+1))# 训练开始for data in train_dataloader:imgs, target = dataoutput = guodong(imgs)loss = loss_fn(output, target)optimizer.zero_grad()loss.backward()optimizer.step()total_train_step = total_train_step+1if total_train_step % 100 == 0:print("训练次数:{},Loss:{}".format(total_train_step, loss.item()))

运行结果:(部分)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以看到,随着训练次数的增加,loss整体上在不断变小

三、测试

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterfrom model import *writer = SummaryWriter("train_logs")dataset_train = torchvision.datasets.CIFAR10("dataset1", train=True, transform=torchvision.transforms.ToTensor(), download=True)
dataset_test = torchvision.datasets.CIFAR10("dataset1", train=False, transform=torchvision.transforms.ToTensor(),download=False)dataset_train_size = len(dataset_train)
dataset_test_size = len(dataset_test)
print("训练集的数据长度为{}".format(dataset_train_size))
print("测试集的数据长度为{}".format(dataset_test_size))train_dataloader = DataLoader(dataset_train, batch_size=64)
test_dataloader = DataLoader(dataset_test, batch_size=64)# 创建网络模型
guodong = Guodong()# 损失函数
loss_fn = nn.CrossEntropyLoss()# 优化器
learning_rate = 1e-2
optimizer = torch.optim.SGD(guodong.parameters(), learning_rate)# 设置训练网络的一些参数
total_train_step =0
total_test_step = 0
epoch = 10for i in range(10):print("------第{}次训练开始------".format(i+1))# 训练开始for data in train_dataloader:imgs, targets = dataoutputs = guodong(imgs)loss = loss_fn(outputs, targets)optimizer.zero_grad()loss.backward()optimizer.step()total_train_step = total_train_step+1if total_train_step % 100 == 0:# print("训练次数:{},Loss:{}".format(total_train_step, loss.item()))writer.add_scalar("train_loss", loss.item(), total_train_step)total_test_loss = 0with torch.no_grad():for data in test_dataloader:imgs, targets = dataoutputs = guodong(imgs)loss = loss_fn(outputs, targets)total_test_loss = total_test_loss + loss.item()print("整体测试集上的Loss:{}".format(total_test_loss))writer.add_scalar("test_loss", total_test_loss, total_test_step)writer.close()

运行结果:

在这里插入图片描述
打开tensorboard后,结果如下:

在这里插入图片描述

四、完整的训练和测试代码

主要功能:
加载和准备CIFAR-10数据集,以便训练和测试深度学习模型。
创建一个自定义的深度学习模型(Guodong),并定义损失函数和优化器。
执行训练循环和测试循环,通过反向传播优化模型参数,并评估模型在测试集上的性能。
使用TensorBoard记录训练过程中的损失和准确率等信息,以便后续分析和可视化。
保存训练后的模型参数到文件中,以便后续部署和使用。

此外

在深度学习中,通常使用**.train().eval()**这两个方法来设置模型的训练模式和评估模式。这两个方法通常用于 PyTorch 或 TensorFlow 等深度学习框架。

.train(): 这个方法将模型设置为训练模式。在训练模式下,模型会启用训练相关的功能,比如启用 dropout 或 batch normalization 层的运算,以及计算梯度用于参数更新。当调用该方法后,模型会处于可以接受输入数据并进行前向传播、反向传播的状态。

.eval(): 这个方法将模型设置为评估模式。在评估模式下,模型会关闭一些训练过程中的特殊操作,如 dropout 或 batch normalization 的自适应性,以确保在推理阶段的一致性。评估模式通常用于模型在验证集或测试集上的性能评估,以保证评估结果的稳定性和一致性。

通过在训练和评估阶段分别调用.train()和.eval()方法,可以确保模型在不同阶段有正确的行为表现,从而提高训练和评估的效果和可靠性。

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterfrom model import Guodong  # 导入自定义的模型类# 创建TensorBoard的SummaryWriter,用于记录训练过程中的损失和准确率等信息
writer = SummaryWriter("train_logs")# 加载CIFAR-10数据集
dataset_train = torchvision.datasets.CIFAR10("dataset1", train=True, transform=torchvision.transforms.ToTensor(), download=True)
dataset_test = torchvision.datasets.CIFAR10("dataset1", train=False, transform=torchvision.transforms.ToTensor(), download=False)dataset_train_size = len(dataset_train)
dataset_test_size = len(dataset_test)
print("训练集的数据长度为{}".format(dataset_train_size))
print("测试集的数据长度为{}".format(dataset_test_size))# 创建训练和测试数据加载器
train_dataloader = DataLoader(dataset_train, batch_size=64)
test_dataloader = DataLoader(dataset_test, batch_size=64)# 创建网络模型实例
guodong = Guodong()# 定义损失函数和优化器
loss_fn = nn.CrossEntropyLoss()
learning_rate = 1e-2
optimizer = torch.optim.SGD(guodong.parameters(), learning_rate)# 设置训练网络的一些参数
total_train_step = 0
total_test_step = 0
epoch = 10for i in range(10):print("------第{}次训练开始------".format(i + 1))guodong.train()# 训练开始for data in train_dataloader:imgs, targets = dataoutputs = guodong(imgs)loss = loss_fn(outputs, targets)optimizer.zero_grad()loss.backward()optimizer.step()total_train_step += 1if total_train_step % 100 == 0:writer.add_scalar("train_loss", loss.item(), total_train_step)# 测试开始guodong.eval()total_test_loss = 0total_accuracy = 0with torch.no_grad():for data in test_dataloader:imgs, targets = dataoutputs = guodong(imgs)loss = loss_fn(outputs, targets)total_test_loss += loss.item()accuracy = (outputs.argmax(1) == targets).sum()total_accuracy += accuracyprint("整体测试集上的Loss:{}".format(total_test_loss))print("整体测试集上的正确率:{}".format(total_accuracy / dataset_test_size))writer.add_scalar("test_loss", total_test_loss, total_test_step)writer.add_scalar("test_accuracy", total_accuracy / dataset_test_size, total_test_step)# 保存模型torch.save(guodong.state_dict(), "guodong_{}.pth".format(i))print("模型已保存")total_test_step += 1writer.close()

代码运行结果:

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/522793.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在ubuntu上使用vscode+gcc-arm-none-eabi+openocd工具开发STM32

文章目录 所需工具安装调试搭建过程中遇到的问题 写在前面 老大上周让我用vscode开发STM32,我爽快的答应了,心想大学四年装了这么多环境了这不简简单单,更何况vscode这两年还用过,然而现实总是令人不快的——我竟然花了差不多两周…

BlackHole

BlackHole 文章目录 BlackHole一、关于 BlackHole功能描述 二、安装、卸载安装方式一:下载安装器方式二:使用 Homebrew 安装 卸载方式一:使用卸载器方式二:手动卸载 三、用户使用指南1、Logic Pro X2、GarageBand3、Reaper4、录制…

Material UI 5 学习02-其它按钮组件

Material UI 5 学习02-其它按钮组件 一、IconButton按钮二、 ButtonGroup按钮组1、最基本的实例2、垂直按钮组 一、IconButton按钮 图标按钮通常适用于切换按钮&#xff0c;允许选择或选择单个选项 取消选择&#xff0c;例如在项目中添加或删除星号。 <IconButton aria-lab…

牛客小白月赛88

E.多重映射 解题思路 对集合进行整体操作&#xff0c;集合大小只增不减&#xff0c;问最后集合标号维护集合&#xff0c;考虑并查集但直接用并差集维护会有以下问题&#xff1a;当前集合变标号&#xff0c;可能会和之前标号相同&#xff0c;则进行并查集操作时&#xff0c;会接…

Windows下Node.js安装保姆级教程

一、Node.js 下载 访问Node.js官网&#xff0c;点击下载Node.js 下载完成后即可在下载文件中查看安装包 二、安装 一&#xff09;点击安装包开始安装&#xff0c;进入Weclcome界面点击Next 二&#xff09;勾选同意协议&#xff0c;点击Next 三&#xff09;根据需要选择安装路…

事务失效问题

1&#xff0c;事务方法非public修饰 由于Spring的事务是基于AOP的方式结合动态代理来实现的。因此事务方法一定要是public的&#xff0c;这样才能便于被Spring做事务的代理和增强。 2&#xff0c;非事务方法调用事务方法 Service public class OrderService {public void creat…

0201安装报错-hbase-大数据学习

1 基础环境简介 linux系统&#xff1a;centos&#xff0c;前置安装&#xff1a;jdk、hadoop、zookeeper&#xff0c;版本如下 软件版本描述centos7linux系统发行版jdk1.8java开发工具集hadoop2.10.0大数据生态基础组件zookeeper3.5.7分布式应用程序协调服务hbase2.4.11分布式…

SpringBoot整合Redis实现分布式锁

SpringBoot整合Redis实现分布式锁 分布式系统为什么要使用分布式锁&#xff1f; 首先&#xff0c;分布式系统是由多个独立节点组成的&#xff0c;这些节点可能运行在不同的物理或虚拟机器上&#xff0c;它们通过网络进行通信和协作。在这样的环境中&#xff0c;多个节点可能同…

JavaWeb笔记 --- 一JDBC

一、JDBC JDBC就是Java操作关系型数据库的一种API DriverManager 注册驱动可以不写 Class.forName("com.mysql.jdbc.Driver"); Connection Statement ResultSet PrepareStatement 密码输入一个SQL脚本&#xff0c;直接登录 预编译开启在url中 数据库连接池

git搜索历史上曾经的文本内容

文章目录 问题在命令行搜索历史内容参考 问题 我们知道&#xff0c;github有文本搜索功能&#xff1a; 比如想搜哪些文件内容包括 aaa &#xff0c;在搜索框中输入 aaa &#xff1a; 但是&#xff0c;如果是历史上曾经有过的文本&#xff0c;这个办法貌似不行。 比如文件 tes…

蓝桥杯集训·每日一题2024 (二分,双指针)

前言&#xff1a; 开学了&#xff0c;平时学习的压力也逐渐大起来了&#xff0c;不过还算可以接受&#xff0c;等到后面阶段考的时候就不一样了&#xff0c;我目前为了转专业退选了很多课&#xff0c;这些课我都需要花时间来刷绩点&#xff0c;不然保研就没有竞争力了。我自己会…

idea配置汇总【2023】最新外观配置和常规操作配置

界面 如果是IDEA请移步去其他人之前的文章看已经烂大街了&#xff0c;这是最新版的一些新功能的配置研究&#xff0c;毕竟天天看它不好看点怎么能行 ①tool windows 在新版&#xff08;不一定是当前年份的最新版&#xff09;idea中针对界面tool window有了新的优化&#xff0c…