关于RTX 4090 微调llama2模型时出现nvcc fatal : Unsupported gpu architecture compute

关于RTX 4090 微调llama2模型时出现nvcc fatal : Unsupported gpu architecture compute_89的解决办法

news/2025/1/11 14:51:39/文章来源:https://www.cnblogs.com/zhangxianrong/p/18408602

RTX 4090是现在普通人可以轻松获取的最好的显卡了。运算速度仅次于专业图形卡Tesla A100，A800，H100

RTX4090显卡是可以单卡推理llama2 7b和13b模型的，7b模型占用缓存14G左右，13b模型单卡推理显存占用在23G多点(只是运行一段时间容易爆显存)，所以普通人都是可以使用llama2大语言模型。

RTX 4090单卡推理llama-2-13b-chat-hf

因为llama2在训练的时候，中文语料较少，加上没有针对中文做专门的训练，导致不能使用中文来回答，

这时候需要使用大量中文语料对llama2进行微调。

但是rtx 4090在微调时容易出现如下报错：

nvcc fatal : Unsupported gpu architecture 'compute_89'

ninja: build stopped: subcommand failed.

AttributeError: 'DeepSpeedCPUAdam' object has no attribute 'ds_opt_adam'

原因是conda环境下cuda编译器nvcc不支持compute_89导致安装失败，运行项目的requirement.txt安装环境往往会默认安装低版本的cuda环境。

可以在conda环境下使用nvcc --list-gpu-arch来查看

如果没有compute_89（nvcc --version版本是11.5或者以下），就需要重新安装cuda和nvcc

以ubuntu22.04为例，依次运行一下代码：

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin 
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600 
wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda-repo-ubuntu2204-12-2-local_12.2.0-535.54.03-1_amd64.deb 
sudo dpkg -i cuda-repo-ubuntu2204-12-2-local_12.2.0-535.54.03-1_amd64.deb 
sudo cp /var/cuda-repo-ubuntu2204-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/ 
sudo apt-get update 
sudo apt-get -y install cuda

安装完成后，可以查看cuda 12.2版本安装位置

sudo find / -name cuda-12.2

一般在/usr/local/cuda-12.2下

修改.bashrc

vim ~/.bashrc

增加新cuda环境变量

export CUDA_HOME=/usr/local/cuda-12.2 
export PATH=/usr/local/cuda-12.2/bin:$PATH 
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH

更新环境变量

source ~/.bashrc

再次查看nvcc --list-gpu-arch是否有compute_89

如果没有的话，可以用which nvcc查看nvcc目录

which nvcc

如果nvcc目录不是/usr/local/cuda-12.2 ，需要重新配置，先备份下原环境，然后重新配置

sudo mv /usr/bin/nvcc /usr/bin/nvcc.bak 
sudo ln -s /usr/local/cuda-12.2/bin/nvcc /usr/bin/nvcc

这样就可以了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/795551.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

从注册到实战，超简单图床使用（附代码实现本地图片转换为网络url）

1.注册一个薄荷图床的的账号，并添加客服申请api测试权限查看api文档我们只需关注两个必选参数即可，如图中红色标注 2.编写pthon代码其他语言也可以，只要发送post请求即可，注意url、token和照片需要更改为你自己的 import requestsdef python_demo():url = https:…

【开源分享】PHP 在线客服系统源码全开源无加密，支持自动刷新网页即时接收消息

智能化在线客服系统也是其中一个必备功能。其智能化主要体现在细节中，在保持客服人员工作正常进行的情况下，让效率变高。智能化在线客服系统采取“轮询”的工单分配方式，让合适的客服人员处理合适的问题；提供“视图”功能，让客服人员专注于重要工单；强大的“搜索”功能，…

网络安全事件应急响应之专家运营篇

原创袁哥大话安全袁哥大话安全一、工作内容网络安全应急响应人员针对安全监测人员、业务部门或上级部门反馈的疑似安全事件进行研判，根据研判情况进行实际的上机排查和调查，以确定安全事件的原因、影响范围和解决方案。网络安全事件应急响应的一般步骤： 1.1 网络安全事…

软件工程作业2：论文查重

论文查重 Github链接这个作业属于哪个课程软件工程课程这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13229这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/这个作业的目标按照要求写一个查重软件PSP2.1 Personal…

24小时搜书Z-library最新国内访问入口镜像网址（持续更新）

24小时搜书Z-library简介24小时搜书Z-library，这是一个基于 IPFS 的电子书搜索引擎，收录了大量图书，据介绍有 1000万本以及8000篇文章，可以通过书名、作者、出版社、扩展名、ISBN 等多种信息进行搜索。各种常见的电子书格式如 pdf、mobi、epub、azw3 等都支持下载。Z-libra…

PDshell16反向pgsql中 Unable to list the columns. SQLSTATE = 22003不良的类型值 short : t 的解决方案

问题原因：pdshell逆向pg的sql脚本滞后，与pg新版本不兼容，解决方案：修改掉不兼容的sql代码1、Database->Edit Current DBMS，如下 2、PostgreSQL 9.x->Script->Objects找到Column和Key；如下 3、将 Column->SqlListQuery 选项里 SELECT 中的 c.attnotnull 替换…

高精度监测土体压应力变化量的最佳选择 GEO系列振弦式土压力计

高精度监测土体压应力变化量的最佳选择 GEO系列振弦式土压力计GEO系列振弦式土压力计广泛适用于长期测量土石坝、防波堤、护岸、码头岸壁、高层建筑、管道基础、桥墩、挡础所受土体的压应力，是了解土体对土中构筑物压应力变化量的有效监测设备。同时，它还可以同步测量埋设点的…

论文阅读翻译之Deep reinforcement learning from human preferences

论文阅读翻译之Deep reinforcement learning from human preferences 关于首次发表日期：2024-09-11 论文原文链接：https://arxiv.org/abs/1706.03741 论文arxiv首次提交日期：12 Jun 2017 使用KIMI，豆包和ChatGPT等机翻，然后人工润色如有错误，请不吝指出Deep reinforceme…

最大熵原理[解释+例题]

1 熵的概念熵是热力学中的一个概念，由香浓引入到信息论中。在信息论中，熵是衡量随机变量不确定性的量度，熵越大表示随机变量的不确定性越大，即随机变量越难以预测。 2 熵的计算信息熵的计算可以看笔者的博客：点此跳转。 3 最大熵原理定义最大熵原理是一种选择随机变量统…

9.9 ~ 9.15

没有摘要9.9 whk 正常上课。感觉自己一到教室就困，怎么会是呢总不能是教室人太多缺氧了吧（ OI 我干啥了？我干啥了？我干啥了？ 9.10 whk 教师节。所以每节课上课之前我们都会起立并大喊“祝老师教师节快乐”；然后在奥赛课上也这么干了，给了 \(\text{Huge}\) 一点小小的…

PowerDesigner 逆向工程 Could not Initialize JavaVM!

原项目的大量的表，使用PowerDesigner 进行逆向工程。提示Could not Initialize JavaVM! 网上找到原因，PowerDesigner 不可以使用64位JDK环境！有一种不修改环境变量的方法在PowerDesigner目录下，建立一个启动批处理，如：startup.bat，在其中配置JAVA_HOME、CLASSPATH，如…

解锁数据潜力，天翼云TeleDB为企业数智蝶变添力赋能！

近日，第15届中国数据库技术大会（DTCC2024）在北京召开。大会以“自研创新数智未来”为主题，重点围绕向量数据库与向量检索技术实践、数据治理与数据资产管理、云原生数据库开发与实践、特定场景下的数据库管理与优化、大数据平台建设等内容展开分享和探讨。近日，第15届中国…

关于RTX 4090 微调llama2模型时出现nvcc fatal : Unsupported gpu architecture compute_89的解决办法

相关文章