大模型学习笔记九:模型微调

文章目录

    • 一、什么时候需要Fine-Tuning
    • 二、用Hugging Face根据电影评论输出来对电影进行情感分类
      • 1)安装依赖
      • 2)操作流程
      • 3)名字解释
      • 4)代码导入库和加载模型、加载数据库、加载tokenlizer
      • 5)其他相关公共变量赋值(随机种子、标签集评价、标签转token_Id)
      • 6)处理数据集:转成模型接受的输入格式
      • 7)定义数据规整器:训练时自动将数据拆分成Batch
      • 8)定义训练超参:比如学习率
      • 9)定义训练器
      • 10)# 开始训练
      • 11)加载训练后的模型进行推理(参考)
    • 三、训练集和验证集的关系
      • 1)查看训练成果
      • 2)什么是checkpoint?
      • 3)加载训练后的模型进行推理(输入文本,输出neg还是pos)
      • 4)加载checkpoint并继续训练
    • 四、激活函数和模型训练讲解
      • 1)激活函数
      • 2)模型训练
      • 3)调整学习率到合适值
      • 4)如果所有数据都求梯度,计算量太大了
      • 5)求解器

一、什么时候需要Fine-Tuning

1、有私有模型部署的需求
2、开源模型原生的能力不满足业务需求(不微调可操作性就比较大)

二、用Hugging Face根据电影评论输出来对电影进行情感分类

  • Hugging Face介绍
    相当于面向NLP模型的Github,尤其基于transformer的开源模型非常全,封装了模型、训练集、训练器等,让模型下载、使用、训练都非常方便
  • 需求:情感分类
    在这里插入图片描述

1)安装依赖

#pip安装
pip install tarnsformers #安装最新版本
pip install transformers == 4.30 #安装指定版本#conda安装
conda install -c huggingface transformers #只4.0以后的版本

2)操作流程

①加载数据集
②数据预处理(数据按照特定格式拼接输入输出、Tokenizer把文本转Token IDs)
③数据规整器(数据批次Batch)
④加载模型,定义训练超参(针对每个批次训练)
在这里插入图片描述

3)名字解释

1)超参
①模型超参:网络层数、参数维度,Attention Head数,激活函数类型
②训练超参:学习率、批次大小,求解器类型、参数,学习率调节方式、参数,Dropout概率

4)代码导入库和加载模型、加载数据库、加载tokenlizer

  • 导入库
import datasets
from datasets import load_dataset
from transformers import AutoTokenizer, AutoModel
from transformers import AutoModelForCausalLM
from transformers import TrainingArguments, Seq2SeqTrainingArguments
from transformers import Trainer, Seq2SeqTrainer
import transformers
from transformers import DataCollatorWithPadding
from transformers import TextGenerationPipeline
import torch
import numpy as np
import os, re
from tqdm import tqdm
import torch.nn as nn
  • 加载数据集
    通过 HuggingFace,可以指定数据集名称,运行时自动下载
# 数据集名称
DATASET_NAME = "rotten_tomatoes"# 加载数据集
raw_datasets = load_dataset(DATASET_NAME)# 训练集
raw_train_dataset = raw_datasets["train"]# 验证集
raw_valid_dataset = raw_datasets["validation"]
  • 加载模型
    通过 HuggingFace,可以指定模型名称,运行时自动下载
# 模型名称
MODEL_NAME = "gpt2"# 加载模型
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME,trust_remote_code=True)
  • 加载 Tokenizer
    通过 HuggingFace,可以指定模型名称,运行时自动下载对应 Tokenizer
# 加载tokenizer
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/706363.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何组织 Vue 项目

介绍 在启动 Vue 项目时,思考项目结构至关重要。主要考虑因素是预期项目的规模。在本篇博文中,我将探讨适用于不同规模 Vue 项目的各种结构。这个考虑与康威定律相吻合: “设计系统的组织受限于产生这些组织沟通结构的设计。” - 梅尔康威 基…

IC设计企业如何实现安全便捷的芯片云桌面跨网摆渡?

IC设计企业,主要专注于集成电路的设计。这些企业通常包括集成电路、二极管、三极管和特殊电子元件等产品的设计和生产。IC设计企业在其运营和产品设计过程中,会涉及和产生多种文件,如: 项目需求文档:这是项目启动的基础…

联丰策略股票官网分析A股三大指数集体收跌,超3800只股票下跌

查查配今日A股三大指数集体收跌。沪指低开低走,午后A股上了微博热搜。 联丰策略拥有一支由知名互联网公司和国内证券金融机构的行业专家组成的一流运营团队。凭借他们在互联网产品开发和金融风险管理方面的丰富经验,我们的团队致力于为客户提供专业和个性化的证券交易服务。 截…

位拆分与运算

描述 题目描述: 现在输入了一个压缩的16位数据,其实际上包含了四个数据[3:0][7:4][11:8][15:12], 现在请按照sel选择输出四个数据的相加结果,并输出valid_out信号(在不输出时候拉低) 0: 不输出且只有此时的输入有…

猛兽派对是什么游戏 猛兽派对攻略大全 苹果电脑怎么玩《猛兽派对》?

猛兽派对是多人派对类型的游戏,该款游戏的动作基于物理原理设计的,体验游戏玩家可以选择自己喜欢的小动物角色参加派对,游戏内具有很多不同的关卡可供挑战。 在steam平台上,猛兽派对对应英文名称是PartyAnimals,官方正…

用AI帮你写简历,入职啦简历编辑器

简历的重要性 在当前就业形势严峻、竞争加剧的背景下,获取理想工作的难度与日俱增。此时,一份精心准备、亮点突出的简历,成为了您脱颖而出、成功获得面试机会乃至工作offer的关键。面对HR有限的审阅时间和众多应聘者的激烈角逐,如…

深度学习设计模式之工厂方法模式

文章目录 前言一、工厂方法模式介绍二、详细分析1.核心组成2.实现步骤3.示例代码4.优缺点优点缺点 5.应用场景 总结 前言 本篇文章主要学习工厂方法模式,工厂方法模式是对简单工厂模式进一步的抽象,由子类去决定实例化哪个类。 一、工厂方法模式介绍 工…

JavaGUI---JavaFX---未完结

一、Java事件处理机制的应用 JavaFX:JavaFX是Java平台上的一个GUI工具包,它提供了一些内置的事件处理机制。 Swing:Swing是Java平台上的另一个GUI工具包,它也提供了一些内置的事件处理机制。 二、JavaFX和Swing的关键区别&…

electron的Remote模块

03 【electron的Remote模块】 在渲染进程里(比如index.html里面加载了一些js文件,那里面的js如果要使用到 BrowserWindow 这些属性的话就必须使用 remote) 使用 remote 模块, 你可以调用 main 进程对象的方法 1.electron14.0之前版本使用 …

手机自养号测评系统:专业应对电商平台风控,提升账号稳定性

用手机做自养号测评它具备无限生成不同真实手机底层环境的能力,每个环境都相当于一台全新的手机设备。通过先进的底层屏蔽技术,我们成功让亚马逊等平台仅能检测到我们预设的参数,如手机型号、内存、lMEI、序列号、MAC地址以及运营商信息等。每…

svn批量解锁

问题 svn对文件进行checkout之后,先进行lock,之后再去更改,最后进行Commit操作; 上述为我们通过svn管理代码的正常方式,但总会有其他现象发生; 如果我们非正常操作,批量锁所有的svn文件&#x…

谷歌举办Gemini API开发者大赛;ChatGPT iOS版更新支持中文

🦉 AI新闻 🚀 谷歌举办Gemini API开发者大赛,大奖1981款电动DeLorean 摘要:IT之家 5 月 15 日消息,在 2024 年谷歌 I/O 开发者大会上,谷歌宣布举办 Gemini API 开发者大赛,主要面向个人开发者…