【阅读笔记】Chain of LoRA

一、论文信息

1 论文标题

Chain of LoRA: Efficient Fine-tuning of Language Models via Residual Learning

2 发表刊物

arXiv2023

3 作者团队

Department of Computer Science, Princeton University
School of Computer Science and Engineering, Nanyang Technological University

4 关键词

LLMs、LoRA

二、文章结构

COLA
Introduction
Related Work
Adapter based methods
Prefix tuning methods
LoRA and its variants
Method
Preliminaries
LoRA
Frank-Wolfe
Chain of LoRA
Tune LoRA
Tie a knot
Extend the chain
Convergence of COLA and the Nonconvex Frank-Wolfe method
Experimental Framework
Implementation details
Main Results
Experimental Setup
Models and Tasks
models
datasets
methods compared
Implementation details
Results and Analysis
Main Results
Ablation Study
Conclusion and future work

三、主要内容

论文探讨了如何通过残差学习来提高大型语言模型(LLMs)在特定任务上的微调效率。作者提出了Chain of LoRA (COLA) 方法,这是一种迭代优化框架,灵感来源于Frank-Wolfe算法,旨在在不增加额外计算成本或内存开销的情况下,缩小LoRA(低秩适应)与全参数微调之间的泛化误差差距。

四、相关研究

相关研究包括LoRA(低秩适应)及其变体,它们通过训练较小的低秩矩阵来近似权重更新,以提高微调效率。此外,还有参数高效的微调方法(PEFT),如Prefix tuning和Adapter-based方法,它们通过修改模型参数的较小部分来适应特定任务。

五、解决方案

COLA通过迭代地微调、合并和扩展LoRA模块来构建一个LoRA链。这种方法通过学习残差信息来逐步逼近最优权重更新,而不是从头开始学习整个权重更新。COLA在微调过程中,将学习到的LoRA模块合并到预训练的语言模型参数中,并为新生成的LoRA模块重置优化器状态。
在这里插入图片描述

六、实验环节

论文在OPT-1.3B和Llama2-7B两个大型语言模型上进行了实验,并在七个基准任务(SST-2, WSC, CB, WIC, BoolQ, MultiRC, RTE)上进行了评估。实验结果表明,COLA在保持相同或更低的计算成本的同时,能够持续地优于LoRA。

七、进一步探索点:

  1. 应用COLA与不同的基础优化器。
  2. 在更大的语言模型上进行进一步实验。
  3. 在分类任务之外,探索COLA在生成、摘要和多选任务上的应用。

八、总结

Chain of LoRA (COLA) 是一种新的微调框架,它通过迭代优化和残差学习来提高大型语言模型在特定任务上的性能。与现有的LoRA方法相比,COLA在不增加计算成本的情况下,能够实现更好的泛化性能。通过实验验证,COLA在多个模型和任务上都显示出了其有效性,并为未来的研究提供了新的方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/340963.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023年人工智能的最新发展(下)

目录 1.MidJourney: 2.GAN: 3.Diffusion Model 4.DALLE、Disco Diffusion 5.Stable Diffusion 1.MidJourney: 2023年3月,一组中国小情侣的照片在网络上迅速走红。这组照片看起来普通,就像一对小情侣的合影,但实…

Go后端开发 -- 条件、循环语句 defer语句

Go后端开发 – 条件、循环语句 && defer语句 文章目录 Go后端开发 -- 条件、循环语句 && defer语句一、条件语句1.if ... else 语句2.switch语句3.select语句 二、循环语句1.for循环 三、defer语句1.defer语句的作用2.defer和return的先后顺序3.recover错误拦截…

212. 单词搜索 II(字典树的另一种类型)

大致思路是: 根据words列表建立字典树,其中注意在单词末尾,将原来的isEnd变量换成存储这个单词的变量,方便存储到ans中,另外,字典树的字节点由原来的Trie数组变为hashmap,方便检索字母。 建立…

C++ n皇后问题 || 深度优先搜索模版题

n− 皇后问题是指将 n 个皇后放在 nn 的国际象棋棋盘上,使得皇后不能相互攻击到,即任意两个皇后都不能处于同一行、同一列或同一斜线上。 现在给定整数 n ,请你输出所有的满足条件的棋子摆法。 输入格式 共一行,包含整数 n 。 …

动态规划day03

343. 整数拆分(第二次做还是没弄明白) 力扣题目链接(opens new window) 给定一个正整数 n,将其拆分为至少两个正整数的和,并使这些整数的乘积最大化。 返回你可以获得的最大乘积。 示例 1: 输入: 2输出: 1解释: 2 1 1, 1 1 1。 示例 2: 输入: …

黑马程序员JavaWeb开发|案例:tlias智能学习辅助系统(4)员工管理|修改员工、配置文件

指路(1)(2)(3)👇 黑马程序员JavaWeb开发|案例:tlias智能学习辅助系统(1)准备工作、部门管理_tlias智能学习辅助系统的需求分析-CSDN博客https://blog.csdn.n…

AI人工智能的发展趋势及未来展望

人工智能(Artificial Intelligence,简称AI)作为一门拥有悠久历史但最近才得到广泛关注的领域,正在以惊人的速度推动着科技进步和社会变革。近年来,随着计算能力、数据规模和算法研究的不断突破,人工智能已经…

java通过HttpClient方式实现https请求的工具类(绕过证书验证)

目录 一、引入依赖包二、HttpClient方式实现的https请求工具类三、测试类 一、引入依赖包 引入相关依赖包 <!--lombok用于简化实体类开发--><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId><option…

MySQL批量插入技巧

关于MySQL批量插入的一些问题 MySQL一直是我们互联网行业比较常用的数据&#xff0c;当我们使用半ORM框架进行MySQL大批量插入操作时&#xff0c;你是否考虑过这些问题: 进行大数据量插入时&#xff0c;是否需要进行分批次插入&#xff0c;一次插入多少合适&#xff1f;有什么…

泡泡玛特台北旗舰店打造“乐园式体验”,打造西门町新地标

近日&#xff0c;泡泡玛特台北旗舰店盛大开业&#xff0c;矗立于西门町核心商圈的壮观五层独栋建筑吸引大量游客驻足。作为年度收官之作&#xff0c;该店总面积700多平方米&#xff0c;售卖超过千款潮玩。各楼层经过精心规划&#xff0c;除了各大IP最新款潮玩产品及衍生品之外&…

[蓝桥杯学习] 树状树组

lowbit操作 数字二进制表达中的最低位1以及后面所有的0&#xff0c;函数写法如下&#xff1a; int lowbit(int x){return x&-x;} 例如说&#xff0c;lowbit(0101100100) (100) lowbit(4) 4 lowbit(6) 2 时间复杂度o(1) 树状数组 应用 进行单点修改和区间查询…

第 378 场 LeetCode 周赛题解

A 检查按位或是否存在尾随零 枚举&#xff1a;枚举两个元素的组合即可 class Solution { public:bool hasTrailingZeros(vector<int> &nums) {int n nums.size();for (int i 0; i < n; i)for (int j 0; j < i; j)if ((nums[i] | nums[j]) % 2 0)return tru…