Ubuntu18中NVIDIA,cuda,cudnn,pytorch安装

注意:nvidia驱动和cuda,cudnn,pytroch,python的对应关系

linux安装pytorch(包括cuda与cudnn)_linux清华园按照pytorch1.12_BryceRui的博客-CSDN博客

安装流程:安装cuda(包括nvidia驱动)+ cudnn + python安装

注意:nvidia驱动可以在安装cuda时一起安装

1、安装NVIDIA驱动(该驱动也可以在cuda安装时一起安装)

Ubuntu 18.04 NVIDIA驱动安装总结_ObsessionLife的博客-CSDN博客

最近遇到了在Ubuntu 18.04上安装NVIDIA的情况,看到一篇英文教程讲解的很好,简单翻译一下拿来收藏。

在Ubuntu 18.04上安装NVIDIA有三种方法:

使用标准Ubuntu仓库进行自动化安装

使用PPA仓库进行自动化安装

使用官方的NVIDIA驱动进行手动安装

上述三种方法均可用,我个人更习惯于使用手动安装。

注意:

在安装之前首先就是要禁用Nouveau的驱动,禁用该驱动的方法参照这篇博客。

https://www.cnblogs.com/smartcoding/p/15353414.html

ubuntu禁止自动更新内核_ubuntu取消内核自动更新_maohule的博客-CSDN博客

1.查看系统安装的内核有哪些

  dpkg --get-selections | grep linux-image

2.查看系统正在使用的内核

  uname -a

禁止更新内核:

sudo apt-mark hold linux-image-4.13.0-36-generic
sudo apt-mark hold linux-image-extra-4.13.0-36-generic
sudo apt-mark hold linux-headers-4.13.0-36-generic

如果需要恢复原来的设定的话即允许更新内核,执行如下命令即可:

sudo apt-mark unhold linux-image-4.13.0-36-generic
sudo apt-mark unhold linux-image-extra-4.13.0-36-generic

————————————————

上一步的改动只是在安装的时候临时禁用。如果没有永久禁用该驱动,可能会出现安装完毕NIVIDA显卡后无法进入Ubuntu的情况(在登录界面,输入密码也无法登录)。

所以,在安装后Ubuntu成功后需要在grub的配置文件里面更改:

在文本中搜索quiet splash 然后添加acpi_osi=linux nomodeset,保存文本即可。

1. 使用标准Ubuntu 仓库进行自动化安装

这种方法几乎是所有的示例中最简单的方法,也是该教程最为推荐的方法。首先,检测你的NVIDIA显卡型号和推荐的驱动程序的模型。在命令行中输入如下命令:

== cpu-microcode.py ==

1. 使用标准Ubuntu 仓库进行自动化安装

这种方法几乎是所有的示例中最简单的方法,也是该教程最为推荐的方法。首先,检测你的NVIDIA显卡型号和推荐的驱动程序的模型。在命令行中输入如下命令:

$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00001180sv00001458sd0000353Cbc03sc00i00
vendor   : NVIDIA Corporation
model    : GK104 [GeForce GTX 680]
driver   : nvidia-304 - distro non-free
driver   : nvidia-340 - distro non-free
driver   : nvidia-384 - distro non-free recommended
driver   : xserver-xorg-video-nouveau - distro free builtin== cpu-microcode.py ==
driver   : intel-microcode - distro free

从输出结果可以看到,目前系统已连接Nvidia GeFrand GTX 680显卡,建议安装驱动程序是 nvidia-384版本的驱动。如果您同意该建议,请再次使用Ubuntu驱动程序命令来安装所有推荐的驱动程序。

输入以下命令:

sudo ubuntu-drivers autoinstall

一旦安装结束,重新启动系统(不重启可能会出现nvidia不匹配等错误),

$ sudo reboot

你就完成了。

输入

nvidia-smi

出现一些现实,说明驱动安装正确

sudo apt

install nvidia-driver-418

#去除之前的nvidia显卡驱动

sudo apt-get autoremove --purge nvidia-*

sudo apt-get remove --purge 'nvidia\.*'sudo apt autoremove

一旦安装结束,重新启动系统(不重启可能会出现nvidia不匹配等错误),

你就完成了。

输入

出现一些现实,说明驱动安装正确

CUDA Toolkit and Minimum Compatible Driver Versions

CUDA Toolkit

Linux x86_64 Driver Version

Windows x86_64 Driver Version

CUDA 11.2.2 Update 2

>=460.32.03

>=461.33

CUDA 11.2.1 Update 1

>=460.32.03

>=461.09

CUDA 11.2.0 GA

>=460.27.03

>=460.82

CUDA 11.1.1 Update 1

>=455.32

>=456.81

CUDA 11.1 GA

>=455.23

>=456.38

CUDA 11.0.3 Update 1

>= 450.51.06

>= 451.82

CUDA 11.0.2 GA

>= 450.51.05

>= 451.48

CUDA 11.0.1 RC

>= 450.36.06

>= 451.22

CUDA 10.2.89

>= 440.33

>= 441.22

CUDA 10.1 (10.1.105 general release, and updates)

>= 418.39

>= 418.96

CUDA 10.0.130

>= 410.48

>= 411.31

CUDA 9.2 (9.2.148 Update 1)

>= 396.37

>= 398.26

CUDA 9.2 (9.2.88)

>= 396.26

>= 397.44

CUDA 9.1 (9.1.85)

>= 390.46

>= 391.29

CUDA 9.0 (9.0.76)

>= 384.81

>= 385.54

CUDA 8.0 (8.0.61 GA2)

>= 375.26

>= 376.51

CUDA 8.0 (8.0.44)

>= 367.48

>= 369.30

CUDA 7.5 (7.5.16)

>= 352.31

>= 353.66

CUDA 7.0 (7.0.28)

>= 346.46

>= 347.62

2、安装CUDA11.1

ubuntu安装cuda11.2_AI界扛把子的博客-CSDN博客

linux安装pytorch(包括cuda与cudnn)_linux清华园按照pytorch1.12_BryceRui的博客-CSDN博客

CUDA Toolkit 12.2 Update 2 Downloads | NVIDIA Developer

  1. 官网地址

从官网下载cuda,特别注意:要选择run,不要选择deb。

wget http://developer.download.nvidia.com/compute/cuda/11.0.2/local_installers/cuda_11.0.2_450.51.05_linux.runchmod +x cuda_10.1.105_418.39_linux.run sudo ./cuda_10.1.105_418.39_linux.run

这里是下载的cuda 11.1版本

  1. 禁用X服务(黑屏)

  1. 给文件赋执行权限并安装

后续选择accepted,

除了驱动不选择(因为第一步已经安装了nvidia驱动了,如果前面没有安装nvidia,则该选项也需要),其他都选,具体界面如下

  1. 打开配置文件

在末尾添加写入(这个相当于选择cuda-11.1版本)

更新一下

输入nvcc -V,显示cuda版本,检测是否成功

查看版本信息

  1. whereis cuda
  2. whereis cudnn

cuda11.1及以下的卸载:

cuda10.0及以下的卸载:

cd /usr/local/cuda-xx.x/bin/ sudo ./uninstall_cuda_xx.x.pl sudo rm -rf /usr/local/cuda-xx.x

sudo apt-get --purge remove "*cublas*" "cuda*"

3、安装cudnn

  • 下载对应cuda 11.1 的cudnn版本

官网下载,找到与cuda版本配对的cudnn,查看官网配对,以及更全的版本配对,我的cuda为11.1,选择对应的cudnn版本

cuDNN Archive | NVIDIA Developer

https://www.ngui.cc/el/3857815.html?action=onClick

进入到cudnn下载的安装路径下,命令行输入以下命令进行解压操作:

  • 将下载的添加为压缩包并解压 (不同版本,则将cunn-11.1中11.1修改其他版本的数字即可)
tar -xzvf cudnn-10.1-linux-x64-v8.0.5.39.tgz //这里cudnn-10.1-linux-x64-v8.0.5.39.tgz是我们下载的cudnn的压缩包
  • 随后在当前路径的命令行终端输入以下三条命令进行cudnn的安装:
sudo cp cuda/include/cudnn.h    /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*
至此cuda与cudnn全部安装成功。
  • 查看安装的cudnn版本 Ubuntu 18.04安装CUDA 11.4.0 cuDNN 8.2.2_cuda11.4下载_nwth的博客-CSDN博客

会出现如下报错: cat: /usr/local/cuda-11.4/include/cudnn_version.h: 没有那个文件或目录 
错误原因为:在执行 

sudo cp cuda/include/cudnn.h /usr/local/cuda-11.4/include



未把cudnn_version.h文件复制过去。我给的解决方案是执行下面代码:

sudo cp cuda/include/* /usr/local/cuda-11.4/include
sudo cp include/* /usr/local/cuda-11.5/include/
sudo chmod a+r /usr/local/cuda-11.5/lib64/*
sudo chmod a+r /usr/local/cuda-11.5/include/*



 

  • cudnn的卸载

如果有之前的残留版本最好卸载干净,同时路径中的cuda字样,要根据现实来定,cuda有可能需要替换为cuda-9.0或者其他

sudo rm -rf /usr/local/cuda-11.1/include/cudnn.h

sudo rm -rf /usr/local/cuda-11.1/lib64/libcudnn*

四、安装pytroch

根据网址Start Locally | PyTorch选择配置

五、验证

以上安装完成后,打开python,执行以下脚本。

若输出true,则表示cuda可以使用了。然后开始愉快的torch之旅吧。

方法1:查看所有python的路径,不止一个

方法2:查看当前使用的python路径

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/107825.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件设计模式系列之三———工厂方法模式

1 模式的定义 工厂方法模式是一种常见的设计模式,属于创建型设计模式之一,它在软件工程中用于对象的创建。该模式的主要思想是将对象的创建过程抽象化,将具体对象的实例化延迟到子类中完成,以便在不同情况下可以创建不同类型的对…

yolov5训练ExDark数据集(附全过程代码,超详细教程,无坑!)

1.数据集获取 ExDark:免费下载地址 数据内容展示:共12个类别7363张 2.ExDark转yolo格式 ExDark的label文件内容 yolo的label文件内容 转换前准备如下 其中: anndir等于ExDark数据集中的Annotations文件夹,用于存放标签数据…

【LeetCode75】第五十四题 咒语和药水的成功对数

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 题目给我们两个数组,要我们找出第一个数组中每个元素能和另一个数组的元素匹配的数量。匹配的条件是乘积大于特定的值。 那么…

论文阅读《Robust Monocular Depth Estimation under Challenging Conditions》

论文地址:https://arxiv.org/pdf/2308.09711.pdf 源码地址:https://github.com/md4all/md4all 概述 现有SOTA的单目估计方法在理想的环境下能得到满意的结果,而在一些极端光照与天气的情况下往往会失效。针对模型在极端条件下的表现不佳问题&…

【软件测试】selenium3

自动化测试的概念 自动化测试指软件测试的自动化,在预设状态下运行应用程序或者系统,预设条件包括正常和异常,最 后评估运行结果。将人为驱动的测试行为转化为机器执行的过程。 自动化测试就相当于将人工测试手段进行转换,让代码…

flex布局语法以及实操,一文带你吃透flex布局的基础

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 前言 一、Flex是什么? 二、Flex语法知识 1.轴的使用 1.1flex-direction属性 ​编辑 2.基础知识 2.1justify-content属性 2.1.1justify-content: fl…

【HTML5高级第二篇】WebWorker多线程、EventSource事件推送、History历史操作

文章目录 一、多线程1.1 概述1.2 体会多线程1.3 多线程中数据传递和接收 二、事件推送2.1 概述2.2 onmessage 事件 三、history 一、多线程 1.1 概述 前端JS默认按照单线程去执行,一段时间内只能执行一件事情。举个栗子:比方说古代攻城游戏&#xff0c…

CRM软件系统排名靠前的相关推荐

CRM软件是企业管理客户关系的重要工具,它可以帮助企业提高销售效率、增强客户满意度、提升市场竞争力。在众多的CRM软件中,排名靠前的CRM软件有哪些?推荐您一款领先的CRM软件——Zoho CRM。 Zoho CRM是一款全球知名的CRM软件,累计…

Ubuntu18.04系统下通过moveit控制kinova真实机械臂,并用python脚本到达固定点

测试工作空间:test_ws Kinova机械臂型号:m1n6s300 双臂模型中的左臂 测试功能包为kinova-ros官方包 一、读取kinova机械臂末端执行器位姿及tf小知识 1. tf小知识之获取两个连杆坐标系的位姿关系,非常有用,非常有用,非…

Linux tcpdump抓包命令

1.tcpdump抓包命令 -c 指定抓取包的数量,即最后显示的数量 -i 指定tcpdump监听的端口。未指定,选择系统中最小的以配置端口。-i any:监听所有网络端口 -i lo:监听lookback接口。-nn 对监听地址以数字方式呈现,且对端口也以数字方式呈现。…

Ubuntu 22.04安装过程

iso下载地址 Ubuntu Releases 1.进入引导菜单 选择Try or Install Ubuntu Server安装 2.选择安装语言 默认选择English 3.选择键盘布局 默认即可 4.选择安装服务器版本 最小化安装 5.配置网络 选择ipv4 选择自定义 DHCP也可 6.配置代理 有需要可以配置 这里跳过 7.软件源 …

LeetCode518. 零钱兑换 II 以及 动态规划相关的排列组合问题

文章目录 一、题目二、题解方法一:完全背包问题的变体(版本1)方法二:完全背包问题变体(版本2) 三、拓展:先遍历物品后遍历背包vs先遍历背包后遍历物品先遍历物品后遍历背包(组合问题…