阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

在Ubuntu 20.04中安装Nvidia V100 GPU驱动

75次阅读
没有评论

共计 3080 个字符,预计需要花费 8 分钟才能阅读完成。

导读 本文介绍如何在 Ubuntu 20.04 操作系统中禁用 nouveau 驱动,并安装 Nvidia Tesla V100 型号 GPU 的驱动,并安装 CUDA11.6 和 cuDNN。
安装 Ubuntu 20.04.3 LTS 版本

安装 Ubuntu 20.04 按照安装提示,仔细选择每一项,基本默认即可。
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

系统中查看 GPU 信息

系统安装完成之后,进入系统,使用 lspci 命令查询一下 GPU 是否存在、型号信息是什么。

bpang@bobpang:~$ sudo lspci |grep -i nvidia
2f:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
86:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
下载 NVIDIA Tesla V100 驱动

通过 lspci 查询到 GPU 的型号之后,访问官网 nvidia.com 下载驱动程序可以按照如下选择,选择产品类型、系列、型号、然后根据自己的操作系统来选择。
注意:如果操作系统是 Linux,尽量选择 Linux 32-bit/Linux 64-bit,不需要选择详细的 Linux 发行版本。测试是发现选择详细的 Linux 发行版本,安装驱动之后,找不到 nvidia-smi 命令。
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

安装 gcc 等依赖包

当安装 GPU 驱动时,提示缺少相关的依赖包,在此,我们需要提前安装相关的依赖包,目前需要用到的是 gcc , g++ , make:

bpang@bobpang:~$ sudo apt install gcc g++ make
屏蔽 nouveau 开源版本的 GPU 驱动

当系统安装完成之后,会安装系统开源的 NVIDIA 驱动版本,名称为 nouveau。下面将屏蔽该驱动。
首先,创建 /etc/modprobe.d/blacklist-nouveau.conf 文件,

bpang@bobpang:~$ sudo vim /etc/modprobe.d/blacklist-nouveau.conf

将下面内容添加进去:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

创建 /etc/modprobe.d/nouveau-kms.conf 文件,将 options nouveau mdeset= 0 添加进去:

bpang@bobpang:~$ echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

更新一下 initramfs:

bpang@bobpang:~$ sudo update-initramfs -u

重启服务器:

bpang@bobpang:~$ sudo reboot

查看 nouveau 模块是否加载,不显示的话就表示已经禁用:

bpang@bobpang:~$ sudo lsmod | grep nouveau

在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

安装 NVIDIA GPU 驱动

安装下载的 GPU 驱动:NVIDIA-Linux-x86_64-510.47.03.run,目前驱动版本为:510.47.03,如下执行该驱动文件,即可安装。

bpang@bobpang:~$ ./ NVIDIA-Linux-x86_64-510.47.03.run

安装完成之后,可以使用 lspci 看到 GPU 的驱动信息:
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动
使用 nvidia-smi 命令查看 GPU 的信息

bpang@bobpang:~$  nvidia-smi

在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

安装 CUDA 11.6

访问 nvidia 官网,下载 CUDA,cuda 的链接为:https://developer.nvidia.com/cuda-downloads
选择 runfile 文件来安装。
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

bpang@bobpang:~$  wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run
bpang@bobpang:~$  sudo sh cuda_11.6.0_510.39.01_linux.run

如下图,Driver 选项不要勾选了,前面已经安装 GPU 驱动了。
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动
创建环境变量,编辑 ~/.bashrc 文件:

bpang@bobpang:/data/cuda$ vim ~/.bashrc

将下面命令追加到文件最后面:

export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

nvcc 命令创建一个软连接到 /usr/bin 目录:

bpang@bobpang:/data/cuda$ sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc

使用 nvcc 命令查看 cuda 的版本:

bpang@bobpang:/data/cuda$ nvcc --version

在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

验证 CUDA 是否安装成功

下载 CUD 实例文件。因为 CUDA 11.6 版本中 /usr/local/cuda/samples 里面没有实例文件,只有一个 README 文件,内容中告诉你需要从 github 下载,因为 github 太慢,所以从 gitee 中下载实例文件:

bpang@bobpang:~$ git clone https://gitee.com/liwuhaoooo/cuda-samples.git
bpang@bobpang:~$ mv cuda-samples/Samples/* /usr/local/cuda/samples/*
bpang@bobpang:~$ cd /usr/local/cuda/samples/1_Utilities/deviceQuery
$ sudo make
$ ./deviceQuery

在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动

安装 cuDNN

https://developer.nvidia.com/cudnn 从官网下载 cudnn
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动
在 Ubuntu 20.04 中安装 Nvidia V100 GPU 驱动
下载的文件名为:cudnn-linux-x86_64-8.3.2.44_cuda11.5-archive.tar.xz
文件拷贝到服务器。然后安装:

bpang@bobpang:/data$ tar xvf cudnn-linux-x86_64-8.3.2.44_cuda11.5-archive.tar.xz
bpang@bobpang:~$ cd /usr/local/cuda
bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86_64-8.3.2.44_cuda11.5-archive/include/cudnn*.h include/
bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86_64-8.3.2.44_cuda11.5-archive/lib/libcudnn* lib64/
bpang@bobpang:~$ sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h
bpang@bobpang:~$ sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-25发表,共计3080字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中