Centos 7.8 中安装Nvidia A100 GPU驱动

124次阅读

共计 2750 个字符，预计需要花费 7 分钟才能阅读完成。

导读	本文介绍如何在 Centos 7.8 操作系统中禁用 nouveau 驱动，并安装 Nvidia Tesla A100 型号 GPU 的驱动，并安装 CUDA11.6 和 cuDNN。

系统中查看 GPU 信息

系统安装完成之后，进入系统，使用 lspci 命令查询一下 GPU 是否存在、型号信息是什么。

[root@node01 ~]# lspci | grep -i nvidia

下载 NVIDIA Tesla A100 驱动

通过 lspci 查询到 GPU 的型号之后，访问官网 nvidia.com 下载驱动程序可以按照如下选择，选择产品类型、系列、型号、然后根据自己的操作系统来选择。
注意：如果操作系统是 Linux，尽量选择 Linux 32-bit/Linux 64-bit，不需要选择详细的 Linux 发行版本。测试是发现选择详细的 Linux 发行版本，安装驱动之后，找不到 nvidia-smi 命令。
Centos 7.8 中安装 Nvidia A100 GPU 驱动

安装 gcc 等依赖包

当安装 GPU 驱动时，提示缺少相关的依赖包，在此，我们需要提前安装相关的依赖包，目前需要用到的是 gcc , g++ , make：

[root@localhost ~]# yum -y install gcc gcc-c++ kernel-devel make

屏蔽 nouveau 开源版本的 GPU 驱动

当系统安装完成之后，会安装系统开源的 NVIDIA 驱动版本，名称为 nouveau。查看 nouveau 驱动是否加载。

[root@localhost ~]# lsmod |grep -i nouveau

Centos 7.8 中安装 Nvidia A100 GPU 驱动
下面将屏蔽该驱动。编辑 /etc/default/grub 文件，修改 GRUB_CMDLINE_LINUX 一行：

[root@localhost ~]# cat /etc/default/grub

Centos 7.8 中安装 Nvidia A100 GPU 驱动
保存退出，更新 grub:

[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64
Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img
Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6
Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img
done
[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.efi.cfg
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64
Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img
Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6
Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img

Centos 7.8 中安装 Nvidia A100 GPU 驱动
编辑 /lib/modprobe.d/dist-blacklist.conf，把 blacklist nvidiafb 改成 #blacklist nvidiafb，然后在最下面添加blacklist nouveau 和。

[root@localhost ~]# vim /lib/modprobe.d/dist-blacklist.conf
# blacklist nvidiafb
blacklist nouveau
options nouveau modeset=0

Centos 7.8 中安装 Nvidia A100 GPU 驱动

备份 initrams 并使用 dracut 重新建立 initramfs 并重启系统：

[root@localhost ~]# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
[root@localhost ~]# dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
[root@localhost ~]#  reboot

查看 nouveau 模块是否加载，不显示的话就表示已经禁用：

# lsmod | grep nouveau

Centos 7.8 中安装 Nvidia A100 GPU 驱动

安装 NVIDIA GPU 驱动

安装下载的 GPU 驱动：NVIDIA-Linux-x86_64-510.47.03.run，目前驱动版本为：510.47.03，如下执行该驱动文件，即可安装。

[root@localhost ~]# ./NVIDIA-Linux-x86_64-346.47.run

Centos 7.8 中安装 Nvidia A100 GPU 驱动

输入 nvidia-smi 来查看是否可以看到 GPU 信息：

[root@localhost ~]# nvidia-smi

Centos 7.8 中安装 Nvidia A100 GPU 驱动
至此安装完成。

安装 CUDA 11.6

访问 nvidia 官网，下载 CUDA，cuda 的链接为：https://developer.nvidia.com/cuda-downloads
选择 runfile 文件来安装。
Centos 7.8 中安装 Nvidia A100 GPU 驱动

[root@localhost ~]# wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run
[root@localhost ~]# sudo sh cuda_11.6.0_510.39.01_linux.run

如下图，Driver 选项不要勾选了，前面已经安装 GPU 驱动了。
Centos 7.8 中安装 Nvidia A100 GPU 驱动
创建环境变量，编辑 ~/.bashrc 文件：

[root@localhost ~]# vim ~/.bashrc

将下面命令追加到文件最后面：

export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

为 nvcc 命令创建一个软连接到 /usr/bin 目录：

[root@localhost ~]# sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc

使用 nvcc 命令查看 cuda 的版本：

[root@localhost ~]# nvcc --version

正文完

星哥玩云-微信公众号

发表至： linux教程

2024-07-25

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

Golang 修饰器编程

如何使用 awk 的 ‘next’ 命令

MongoDB 删除数据库

springBoot之过滤器和拦截器的使用

如何在Docker Compose中限制容器的CPU和内存使用？

js之浅拷贝和深拷贝

一分钟干货告诉你区块链究竟是啥？

less命令示例【每日一个知识点第319期-Linux】

简单介绍Vue实现鼠标悬浮切换图片src

Centos 7.8 中安装Nvidia A100 GPU驱动

选择PHP与Python，可以考虑这三个问题

Centos 7平滑无缝升级PHP7.1.0到PHP 7.1.5

介绍ansible的Ad-hoc与commands模块

Linux安装使用pidstat命令以对进程数据进行监控

linux下使用tree命令以树形结构显示文件目录结构

Linux 命令行下的数学运算

悄悄告诉你10 条加速 Ubuntu Linux 的杀手级技巧

CentOS7 configuration uses the SFTP server

Vmware三大网络之桥接

CentOS+OpenVZ+Vtonf实现Linux虚拟化