Centos7完全离线环境安装Nvidia Tesla A100 40G显卡驱动(含CUDA Toolkit)和Anaconda3虚拟环境

公司一台完全离线环境的服务器刚装了Nvidia Tesla A100 40G显卡,自己摸索着将显卡驱动在完全离线环境下安装成功,这里记录一下。

一、下载Centos7适配的Nvidia Tesla A100 40G显卡驱动

在Nvidia官网下载Centos7适配的显卡驱动,CUDA Toolkit选择的11.7,没有选择最新的,下载下来的显卡驱动为:nvidia-driver-local-repo-rhel7-515.105.01-1.0-1.x86_64.rpm
在这里插入图片描述
在这里插入图片描述

下面介绍具体的环境准备。

二、操作系统环境

操作系统为Centos7.9.2009,下载下来的ISO名称为:CentOS-7-x86_64-DVD-2207-02.iso
安装时选择的GNOME桌面服务器,并安装了相应的开发程序,默认安装了gcc等软件包。操作系统安装完成后将CentOS-7-x86_64-DVD-2207-02.iso映像文件拷贝到了Centos7操作系统中,以作为本地镜像源。
下面的绝大部分步骤都需要root权限,所以切换到root用户进行下列操作:

三、安装驱动依赖

(一)安装光盘中自带的软件依赖
  1. 创建一个光盘挂载目录
mkdir  /media/cdrom
  1. 挂载iso映像文件
    切换到CentOS-7-x86_64-DVD-2207-02.iso所的目录
mount CentOS-7-x86_64-DVD-2207-02.iso /media/cdrom

会提示已只读方式挂载了光盘。可以进到/media/cdrom看一下有没有挂载成功。
3. 设置光盘为本地yum源

cd /etc/yum.repo.d/
mkdir bak

将目前系统中所有的yum源文件备份一下,全部拷贝到bak目录中

mv * bak

将其中的CentOS-Media.repo拷贝一份出来并修改如下

cp bak/CentOS-Media.repo ./
vi CentOS-Media.repo

只修改其中的一行,将enabled=0修改为enabled=1即可,然后保存退出。
在这里插入图片描述

  1. 更新yum源缓存:
yum clean all
yum makecache

这里没问题的话就可以使用yum install安装相关的软件了。
5. 安装光盘中自带的依赖

yum install gcc kernel-headers kernel-devel

应该是只需要这几个吧,具体的我也忘记了,这里的比较简单,需要啥用yum装就可以了。

(二)安装其它软件依赖

这里需要具体情况具体分析。我的环境缺的软件比较多,另外因为我是离线环境,所以需要把相关的依赖包下载下来再拷贝到服务器上。使用下面的命令可以实现只下载软件包而不安装:

yum install --downloadonly --downloaddir=/home/xxx/yumsofts <software-name>

主要是要下载epel-release,dkms,ocl-icd,opencl-filesystem,vulkan-filesystem,egl-wayland,libvdpau
在下载时会将各个软件的依赖包一起下载下来。
在安装dkms时有个依赖是zlib,下载的是zlib-1.2.7-21.el7_9.x86_64.rpm,但系统中已经默认有了zlib-1.2.7-20,二者冲突,直接使用rpm -Uvh zlib-1.2.7-21.el7_9.x86_64升级一下就可以了。

四、安装显卡驱动

以上都安装好后就可以安装显卡驱动了。这个地方根据Nvidia官网提示安装就可以了
在这里插入图片描述

i) rpm -i nvidia-driver-local-repo-rhel7-515.105.01-1.0-1.x86_64.rpm
ii) yum clean all
iii) yum install cuda-drivers
iv) reboot

如果在安装的过程中还提示缺少依赖,按照上面的方式继续下载安装就可以了。
安装完成后,检查命令:

nvidia-smi

在这里插入图片描述

五、安装Anaconda3试一下pytorch能否使用GPU

(一)安装Anaconda3

下载Linux版本的Anaconda3安装。

(二)在其它联网的centos7计算机上也安装Anaconda3

创建虚拟环境:

conda create -n gpu-torch python=3.10
conda activate gpu-torch

然后安装GPU版的pytorch,安装完成后将gpu-torch虚拟环境所在目录envs下的gpu-torch文件夹整个打包,然后拷贝到离线服务器中envs目录下,在此外解包就可以直接用了。可以使用下面的命令检查能否使用gpu

python3
import torch
print(torch.cuda.is_available())
print(torch.rand(3,3).cuda())

在这里插入图片描述

此时再使用nvidia-smi查看gpu使用情况就会看到python程序了。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/116186.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mybatis-plus异常:dynamic-datasource can not find primary datasource

现象 使用mybatis-plus多数据源配置时出现异常 com.baomidou.dynamic.datasource.exception.CannotFindDataSourceException: dynamic-datasource can not find primary datasource分析 异常原因是没有设置默认数据源&#xff0c;在类上没有使用DS指定数据源时&#xff0c;默…

【WSL】仅适用于装C盘情况-用WSL在win10安装LInux

研究了一点点伪分布式的内容。决定搞一个Linux系统玩一下 参考来自微软官方安装步骤&#xff1a; 旧版 WSL 的手动安装步骤 https://learn.microsoft.com/zh-cn/windows/wsl/install-manual WSL全称为&#xff0c;Windows Subsystem for Linux 法一&#xff1a;应用商店装 查…

pytest框架前后置设置,以及pytest默认规则

一、pytest框架的默认规则 1、模块名默认必须以test开头或者以test结尾 2、测试类必须以Test开头&#xff0c;并且不能有__init__方法 3、测试方法默认必须以test开头 当然以后的一些默认规则除测试类不能使用__init__方法外其余的都是可配置的&#xff0c;当然一般情况下我们…

uni-app 实现自定义按 A~Z 排序的通讯录(字母索引导航)

创建 convertPinyin.js 文件 convertPinyin.js 将下面的内容复制粘贴到其中 const pinyin (function() {let Pinyin function(ops) {this.initialize(ops);},options {checkPolyphone: false,charcase: "default"};Pinyin.fn Pinyin.prototype {init: functi…

2023年9月23日(星期六)骑行哈马者

2023年9月23日 (星期六)&#xff1a;骑行哈马者&#xff0c;早8:30到9:00&#xff0c; 穿金路和沣源路口集合&#xff0c;9:30准时出发 【因迟到者&#xff0c;骑行速度快者&#xff0c;可自行追赶偶遇。】 偶遇地点: 穿金路和沣源路口集合&#xff0c;家住西&#xff0c;南&…

MySQL数据库入门到精通2--基础篇(函数,约束,多表查询,事务)

3. 函数 函数 是指一段可以直接被另一段程序调用的程序或代码。MySQL中的函数主要分为以下四类&#xff1a; 字符串函数、数值函数、日期函数、流程函数。 3.1 字符串函数 MySQL中内置了很多字符串函数&#xff0c;常用的几个如下&#xff1a; 演示如下&#xff1a; A. con…

图像复原与重建,解决噪声的几种空间域复原方法(数字图像处理概念 P4)

文章目录 图像复原模型噪声模型只存在噪声的空间域复原 图像复原模型 噪声模型 只存在噪声的空间域复原

IDEA2023新UI回退老UI

idea2023年发布了新UI&#xff0c;如下所示 但是用起来真心不好用&#xff0c;各种位置也是错乱&#xff0c;用下面方法可以回退老UI

【轨道机器人】成功驱动伺服电机(学生电源、DCH调试软件、DH系列伺服驱动器)

1、硬件平台 工控机 学生电源 DH系列伺服驱动器 电机 调试平台&#xff1a;DCH 2、如何利用dch驱动电机 点击可驱动电机 下面的步骤是比较关键的几步&#xff1a; 3、遇到的问题 不能成功驱动电机&#xff0c;还和厂家那边打电话&#xff0c;询问 发现是这…

Webpack监视文件修改,自动重新打包文件

方法一&#xff1a;使用watch监视文件变化 在终端中输入以下指令&#xff1a; npx webpack --watch 我们使用这种方法监听文件变化时只会监听我们计算机本地的文件变化&#xff0c;在开发场景中我们的项目是要部署到服务器中的&#xff0c;因此这种方式并不推荐。 方法二&…

Vue3 封装 element-plus 图标选择器

一、实现效果 二、实现步骤 2.1. 全局注册 icon 组件 // main.ts import App from ./App.vue; import { createApp } from vue; import * as ElementPlusIconsVue from element-plus/icons-vueconst app createApp(App);// 全局挂载和注册 element-plus 的所有 icon app.con…

IP 协议

IP协议格式 四位版本号 用来表示IP协议的版本,现有的IP协议只有两个版本,IPv4,IPv6,其他版本只在实验室中存在,没有大规模商用 四位首部长度 设定和TCP一样,IP报头是可变长的,IP报头又是带有选项(可以有,可以没有)的,这里的单位也是4个字节,也就是最大有16*464个字节的长度 …