d2l-CV-微调

news/2025/2/8 15:01:23/文章来源:https://www.cnblogs.com/hifrank/p/18704308

微调(fine tuning)是计算机视觉中非常重要的一种技术。
微调的作用：

让在大数据集上训练得到的模型，能够提高在小数据集上任务的精度（例如用ImageNet上训练的模型去识别热狗数据集）
微调是迁移学习(transfer learning)中的一种技术，将从 源数据集 学到的知识迁移到 目标数据集

计算机视觉中的深度神经网络，可以视为两个部分：

特征抽取：将原始像素变成容易线性分割的特征
输出层：线性分类器来做分类

微调的步骤

微调包含4个步骤：

在源数据集上预训练神经网络，即源网络
创建一个新的神经网络模型，即目标模型。将源模型除输出层之外的设计和架构复制到目标模型上。
- 源数据集和目标数据集应该是类似的
- 源数据集在数量、类别上最好大于目标数据集
- 当目标数据集比源数据集小得多时，微调有助于提高模型的泛化能力
添加输出层，输出数量为目标数据集的类别数，随机初始化该层。
在目标数据集上训练目标模型。
- 微调部分的学习率小
- 输出层的学习率大

# 微调部分：特征抽取
finetune_net = torchvision.models.resnet18(pretrained=True)
# 新的输出层，类别为目标数据集的类别（例如：热狗二分类）
finetune_net.fc = nn.Linear(finetune_net.fc.in_features, 2)
# 输出层随机初始化参数
nn.init.xavier_uniform_(finetune_net.fc.weight);

# 如果param_group=True，输出层中的模型参数将使用十倍的学习率
def train_fine_tuning(net, learning_rate, batch_size=128, num_epochs=5,param_group=True):train_iter = torch.utils.data.DataLoader(torchvision.datasets.ImageFolder(os.path.join(data_dir, 'train'), transform=train_augs),batch_size=batch_size, shuffle=True)test_iter = torch.utils.data.DataLoader(torchvision.datasets.ImageFolder(os.path.join(data_dir, 'test'), transform=test_augs),batch_size=batch_size)devices = d2l.try_all_gpus()loss = nn.CrossEntropyLoss(reduction="none")if param_group:params_1x = [param for name, param in net.named_parameters()if name not in ["fc.weight", "fc.bias"]]#  输出层中的模型参数将使用十倍的学习率trainer = torch.optim.SGD([{'params': params_1x},{'params': net.fc.parameters(),'lr': learning_rate * 10}],lr=learning_rate, weight_decay=0.001)else:trainer = torch.optim.SGD(net.parameters(), lr=learning_rate,weight_decay=0.001)d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs,devices)

微调可以视为一种正则化：

使用更小的学习率
使用更少的数据迭代

更多的微调技术

如果源数据集中的部分类别和目标数据集中的相同，可以提取源模型的输出层中的相关部分来初始化目标模型的输出层。
神经网络通常学习有层次的特征表示，可以固定底部的一些层（更强的正则）。
- 低层次的特征更通用（简答的图形）
- 高层次的特征更和数据集相关（语义信息）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/880827.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

“爆款”批量生成，如何实现一键创作 AI 有声绘本？

有声读物作为备受欢迎的内容形式之一，已在教育、影视、文化及娱乐等多个领域广泛应用。本方案通过云原生应用开发平台 CAP、函数计算 FC 和百炼模型服务，实现了有声绘本读物的自动化创作，解决了传统制作中步骤繁琐、周期长和高技术门槛的问题，显著提高了创作效率。作者：寒…

数据可视化分析平台 DataEase

https://www.cnblogs.com/cmt/p/186550891Panel 联合会员已上线，立即了解元旦之后，我们和国内领先的开源软件公司飞致云达成了重要合作，合作分两部分，一是推广飞致云旗下的免费开源软件，一是双方合作推出联合会员。飞致云旗下有多款免费开源软件，1月6日上线了第一个文字…

一文搞懂大模型备案全部内容

大模型备案对象大模型备案主要面向开发、运营大模型的企业、机构等主体（官方要求是具备舆论属性和社会动员能力的产品，而大模型产品基本都符合这两点特征）。比如，像百度开发了文心一言这样的大模型，百度就属于大模型备案的目标群体。大模型备案材料主要材料如下： 1、大…

SeaTunnel数据同步（Oracle to mysql）

因为datax2023年9月以后就没有更新，所以想找个新的切活跃的etl开源工具。 apache SeaTunnel是一个非常易用、超高性能的分布式数据集成平台，支持实时海量数据同步。每天可稳定高效同步数百亿数据，已被近百家企业应用于生产。直接安装体验：export version="2.3.9&quo…

锚索测力计长期预应力水电、铁路、公路、矿山、国防、建筑安全监测

锚索测力计长期预应力水电、铁路、公路、矿山、国防、建筑安全监测精准稳定的振弦式传感器，GEO ACxxxx型振弦式锚索测力计，是长期监测预应力锚索压力的最佳选择。该传感器采用特制的应变计作为传感部件，无需温度修正，可提供准确可靠的测值。适用于预应力锚索的岩体或建筑物…

vs调试.net应用，一运行断点就无法命中，未加载任何符号

原因：没有加载pdb文件导致解决：右键程序集 -> 属性 -> 生成 -> 常规 -> 调试符号由"无"改为"PDB文件，可跨平台移植" 再次运行，断点正常命中

Java教程_002

final关键字 final 关键字是最终的意思，可以修饰（类、方法、变量）修饰类：该类被称为最终类，特点是不能被继承了。修饰方法：该方法被称为最终方法，特点是不能被重写了。修饰变量：该变量只能被赋值一次。 final修饰的变量必须赋值，要么在定义时赋值，要么在构造器中赋…

集合进阶集合容器中只能存放对象，基本数据类型需要使用对应的包装类 Collection单列集合 collection集合体系 collection常用方法package com.itheima.d1_collection;import java.util.ArrayList; import java.util.Arrays; import java.util.Collection; import java.util.…

2020-2025 WebStorm安装+激活

一、下载 1. webstorm各版本官方下载入口官网下载地址 2. 选择左边，然后点击【20xx.x.x-Windows（exe)】 PS: 如需下载特定版本，可以往下拉，都是选择【202x.x-Windows（exe）】下载二、安装 1. 点击运行 ps: 安全警告是部分电脑有，没有跳过就可以了~2. 点击下一步3. 选择安…