PEFT-LISA-编程知识

PEFT-LISA

news/2025/3/17 5:53:36/文章来源:https://blog.csdn.net/transformer_WSZ/article/details/137308418

LISA是LoRA的简化版，但其抓住了LoRA微调的核心，即LoRA侧重更新LLM的底层embedding和顶层head。

phe

根据上述现象，LISA提出两点改进：

始终更新LLM的底层embedding和顶层head
随机更新中间层的hidden state

phe

实验结果

显存占用

gpu

毕竟模型参数大头还是在底层embedding，所以显存占用并没有减少太多。

训练时间

time

下游任务微调

exp

在MT-BENCH上，LISA超过了LoRA，甚至全量参数微调。

参考

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA
LMFlow

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/587879.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

QA测试开发工程师面试题满分问答5: 内存溢出和内存泄漏问题

概念阐述内存溢出（Memory Overflow）和内存泄漏（Memory Leak）是与计算机程序中的内存管理相关的问题，它们描述了不同的情况。内存溢出是指程序在申请内存时，要求的内存超出了系统所能提供的可用内存资源…

el-table实现表格内部横向拖拽效果

2024.4.2今天我学习了如何对el-table表格组件实现内部横向拖拽的效果，效果： 代码如下： 一、创建utils/底下文件 const crosswise_drag_table function (Vue){// 全局添加table左右拖动效果的指令Vue.directive(tableMove, {bind: function…

【信贷后台管理系统之axios的二次封装（四）】

文章目录一、axios的二次封装二、配置后端接口地址三、登录接口api联调四、贷款申请接口api编写联调一、axios的二次封装示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。 src下新建utils,新建request.js用来封装axios 控…

Vue-Next-Admin：适配手机、平板、PC的开源后台管理模板

摘要：随着移动设备和PC的普及，为了满足不同设备的需求，开发一个能够自适应手机、平板和PC的后台管理系统变得至关重要。本文将介绍一个基于Vue3.x、Typescript、Vite、Element Plus等技术的开源模板库——Vue-Next-Admin，帮助开发…

Java多线程实战-从零手搓一个简易线程池(三)线程工厂，核心线程与非核心线程逻辑实现

🏷️个人主页：牵着猫散步的鼠鼠 🏷️系列专栏：Java全栈-专栏 🏷️本系列源码仓库：多线程并发编程学习的多个代码片段(github) 🏷️个人学习笔记，若有缺误，欢迎评论区指正…

flink on yarn

前言 Apache Flink，作为大数据处理领域的璀璨明星，以其独特的流处理和批处理一体化模型，成为众多企业和开发者的首选。它不仅能够在处理无界数据流时展现出卓越的实时性能，还能在有界数据批处理上达到高效稳定的效果。本文将简要…

网络协议学习——HTTPS

目录编辑一，认识HTTPS 二，加密方式 1，对称式加密 2，非对称式的加密 3，数据指纹（数据摘要） 4，数据签名三，HTTPS的工作原理实现方式数字证书一&#xff0c…

加载敌方坦克敌方坦克的方向是随机的，使用随机数生成。初始化敌方坦克。 class EnemyTank(Tank):def __init__(self,left,top,speed):self.images {U: pygame.image.load(img/enemy1U.gif),D: pygame.image.load(img/enemy1D.gif),L: pygame.image.load(img/e…

Golang学习系列1-pprof性能调优

1. pprof 简述一位亦师亦友的话让我记忆犹新，他说“学习一个新事务，应该从三个方面入手what,why,how;且三者的重要程度应该是递减”。所以在本文的第一部分先叙述下pprof的what & why。 1.1 What？ pprof是golang自身提供的一种性能分…

大模型量化技术-GPTQ

大模型量化技术-GPTQ 2022年，Frantar等人发表了论文 GPTQ：Accurate Post-Training Quantization for Generative Pre-trained Transformers。这篇论文详细介绍了一种训练后量化算法，适用于所有通用的预训练 Transformer模型，同时只有微小的性能下降。 GPTQ算法需要通过…

剑指offer打卡 JZ6 从尾到头打印链表

在牛客网刷的，还是跟leetcode一样非acm模式，由于急着暑期实习题量不固定，八股算法轮刷打卡内容偏个人笔记，本人水平一般(代码随想录稀里糊涂刷了一遍)，从小白开始分析(甚至会分析语法)，尽量一题多解深入探…

SpringBoot | Spring Boot“整合Redis“

目录: 1. Redis 介绍2. Redis 下载安装3. Redis “服务开启”和“连接配置”4. Spring Boot整合Redis的“前期准备” :① 编写实体类② 编写Repository 接口③ 在“全局配置文件”中添加 “Redis数据库” 的 “相关配置信息” 5. Spring Boot整合“Redis” (案例展示) 作者简介…

PEFT-LISA

实验结果

显存占用

训练时间

下游任务微调

参考

相关文章

QA测试开发工程师面试题满分问答5: 内存溢出和内存泄漏问题

el-table实现表格内部横向拖拽效果

【信贷后台管理系统之axios的二次封装（四）】

Vue-Next-Admin：适配手机、平板、PC的开源后台管理模板

Java多线程实战-从零手搓一个简易线程池(三)线程工厂，核心线程与非核心线程逻辑实现

flink on yarn

网络协议学习——HTTPS

pygame--坦克大战（二）

Golang学习系列1-pprof性能调优

大模型量化技术-GPTQ

剑指offer打卡 JZ6 从尾到头打印链表

SpringBoot | Spring Boot“整合Redis“