第四届微调——炼丹

学习地址:Tutorial/xtuner/README.md at main · InternLM/Tutorial · GitHub

笔记

微调是一种在已有的预训练模型基础上,通过使用新的数据对模型进行进一步优化和调整的技术手段。它的目的是使模型能够更好地适应特定的应用场景和任务需求,进一步提高模型在特定领域或任务中的性能,包括准确性、泛化能力和适应性等。

微调的方式

  1. 增量预训练微调:在原预训练模型的基础上,继续进行预训练,同时结合新的数据进行微调,以增强模型对特定领域的理解和表现
  2. 指令跟随微调:根据特定的指令或任务要求,对模型进行针对性的微调,使模型能够更好地遵循指令并完成相应任务

微调的数据类型

  1. 技术垂类领域数据:与特定技术领域相关的数据,如特定行业的专业知识、术语等,有助于模型在该领域更深入地理解和处理问题
  2. 高质量对话、问答数据:包含丰富的对话和问答信息的数据,有助于模型提升对话和回答的能力与质量
  3. 特定任务数据集:与具体任务相关的数据,如分类任务的分类标签数据、回归任务的数值数据等,可使模型更好地适应特定任务需求
  4. 多模态数据:结合图像、音频等多模态数据进行微调,可使模型具备处理多模态信息的能力

微调的注意事项

  1. 避免过拟合:在微调过程中要注意控制模型的复杂度,避免过度拟合新的数据,导致模型在其他数据上的性能下降
  2. 选择合适的超参数:根据数据和模型特点,合理选择微调的超参数,如学习率、迭代次数等
  3. 监控模型性能:在微调过程中要持续监控模型的性能变化,及时调整微调策略

微调的应用场景

  1. 自然语言处理:在文本分类、情感分析、机器翻译等任务中,通过微调提高模型的性能
  2. 计算机视觉:在图像分类、目标检测、图像分割等任务中,利用微调使模型更好地适应特定场景
  3. 其他领域:如语音识别、推荐系统等领域,也可通过微调提升模型的性能和适应性

记录:

中间创建多次导致出现多个环境错乱

训练好久了学习其他同学的思维导图:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/696102.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据库系统工程师】2024年5月考前最后冲刺指南

一、备考关键: 高效率的备考方式:多轮迭代学习 △ 基础阶段 △ 大面积撒网(60%) 略读-> 做题 -> 回顾 -> 精读 △ 积累阶段 △ 有针对性的突破(30%) 完成所有章节之后,进行真题测试&#x…

CCF-Csp算法能力认证,202209-1如此编码(C++)含解析

前言 推荐书目,在这里推荐那一本《算法笔记》(胡明),需要PDF的话,链接如下 「链接:https://pan.xunlei.com/s/VNvz4BUFYqnx8kJ4BI4v1ywPA1?pwd6vdq# 提取码:6vdq”复制这段内容后打开手机迅雷…

C++进阶:AVL树详解及模拟实现(图示讲解旋转过程)

C进阶:AVL树详解及模拟实现(图示讲解旋转过程) 之前在搜索二叉树最后早就埋下伏笔,来介绍AVL树和红黑树,今天就先来第一个吧 文章目录 1.AVL树介绍1.1概念介绍1.2核心性质 2.项目文件规划3.整体框架(节点和…

python跟C++选哪个?

选择使用Python还是C取决于你的具体需求和项目背景。我这里有一套编程入门教程,不仅包含了详细的视频讲解,项目实战。如果你渴望学习编程,不妨点个关注,给个评论222,私信22,我在后台发给你。 在通信工程行业…

C++语法|volatile关键字!从CPU角度进行理解

个人认为C有着复杂、臃肿的语法系统,但是也正是因为这些特性,让我们在使用C时既能深入到操作系统级的控制,也能抽象出来完全专注于一些业务问题。 这里为大家推荐一本书和汇编代码阅读网站! 《CPU眼里的C/C》 Compiler Explorer 我…

LeetCode_栈和队列相关OJ题目

✨✨所属专栏:LeetCode刷题专栏✨✨ ✨✨作者主页:嶔某✨✨ 上一篇:数据结构_栈和队列(Stack & Queue)-CSDN博客 有效的括号 解析: 这里我们用数组实现的栈来解决这个问题,在有了栈的几个基础接口之后,我们运用这…

vue3.0(七) 计算属性(computed)

文章目录 1 计算属性(computed )1.1 computed使用1.2 computed使用场景1.4 computed的注意点1.4 computed的原理1.5 computed的示例 computed 和 Methods 的区别 1 计算属性(computed ) 在 Vue 3 中,computed 是一个用…

linux笔记5--shell命令2

文章目录 一. linux中的任务管理1. 图形界面2. 命令① top命令② grep命令③ ps命令补充: ④ kill命令图形界面杀死进程 二. 挂载(硬盘方面最重要的一个知识点)1. 什么是挂载2. 关于挂载目录① Windows② linux查看硬件分区情况(/dev下):更改挂载目录结束…

视频剪辑的技巧:掌握如何高效批量调整视频尺寸的方法

在视频剪辑的过程中,调整视频尺寸是一个常见的需求。无论是为了适应不同平台的播放要求,还是为了统一多个视频的尺寸以提升观看体验,掌握高效批量调整视频尺寸的技巧都显得尤为重要。本文将为您详细介绍云炫AI智剪如何高效地进行这一操作&…

【计算机网络】数据链路层 组帧 习题4

组帧 发送方根据一定的规则将网络层递交的分组封装成帧(也称为组帧)。 组帧时,既要加首部,也要加尾部,原因是,在网络信息中,帧是以最小单位传输的。所以接收方要正确地接收帧,就必须清楚该帧在一串比特串中…

Find My腰包|苹果Find My技术与腰包结合,智能防丢,全球定位

腰包具有显瘦和显高的双重功效,它不仅能提高腰线、拉长腿部线条,还能遮住腹部多余的赘肉,从而在视觉上达到变高的效果,使整体看起来更加显瘦。除了时尚功能,腰包在运动中也有其独特的用途。例如,在跑步时&a…

tab 滑动小案例

效果&#xff1a; 代码&#xff1a; <template><view class"content"><view class"tab"><view v-for"(item,index) in dataList" :key"index" class"tab_item" click"slideTab(index)">…