前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用GPU云服务器搭建深度学习环境(CUDA+CUDNN)

使用GPU云服务器搭建深度学习环境(CUDA+CUDNN)

原创
作者头像
fans
发布2022-04-12 20:39:00
3.5K0
发布2022-04-12 20:39:00
举报

使用环境:腾讯云官方镜像centos8.2

一、安装显卡驱动

1.配置基础环境

1.1、禁用nouveau

nouveau是一个第三方开源的Nvidia驱动,一般Linux安装的时候默认会安装这个驱动。 这个驱动会与Nvidia官方的驱动冲突,在安装Nvidia驱动和CUDA之前应先禁用nouveau。

查看系统是否正在使用nouveau

代码语言:javascript
复制
lsmod | grep nouveau

如果有显示内容,则进行以下的步骤进行禁用nouveau

新建一个配置文件

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在该配置文件中输入i,写入以下内容

代码语言:javascript
复制
 blacklist nouveau 
 options nouveau modeset=0 

保存并退出

:wq!

备份当前的镜像

sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

建立新的镜像

sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)

重启

sudo reboot

最后验证,没有任何显示即为禁用成功

lsmod | grep nouveau

2.安装依赖

输入以下命令安装GCC与G++

yum install gcc

yum install gcc-c++

输入以下命令安装kernel-devel和kernel-headers:

yum install kernel-devel

yum install kernel-headers

3.安装显卡驱动

使用如下命令查看显卡的类型

lspci | grep -i nvidia

root@VM-0-10-centos ~]# lspci | grep -i nvidia

00:08.0 3D controller: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)

这里可以看到我的显卡是Tesla T4 我们需要前往英伟达官网查看所支持该显卡的驱动版本

Official Drivers | NVIDIA

下载驱动文件 并上传到服务器中

cd跳转到驱动所在的目录下,并给予执行权限

chmod u+x NVIDIA-Linux-x86_64-450.172.01.run

完成后执行安装脚本

代码语言:javascript
复制
sudo ./NVIDIA-Linux-x86_64-450.172.01.run --kernel-source-path=/usr/src/kernels/4.18.0-348.7.1.el8_5.x86_64

代码语言:javascript
复制
输入 nvidia-smi 

如果看到以下输出则代表安装成功

二、安装CUDA

在英伟达官网下载对应版本的CUDA CUDA Toolkit 11.0 Download | NVIDIA Developer

进行如图所示选择 并且复制到服务器内运行

下载完成之后记得赋予文件777权限

代码语言:javascript
复制
执行 sudo sh cuda_11.0.2_450.51.05_linux.run

2、配置环境变量

vim /etc/profile

代码语言:javascript
复制
第一次发布
export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}} 
export LD_LIBRARY_PATH=/usr/local/cuda-%11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
第二次发布
export PATH=/usr/local/cuda/bin:$PATH 
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

source /etc/profile

完成之后记得重启

3、验证CUDA是否安装成功

输入nvcc -V

如果看到以下输出 则代表安装成功

三、安装CUDNN

在官网下载对应版本的cudnnNVIDIA cuDNN | NVIDIA Developer

将其通过FTP传送到服务器内 并进行解压

cudnn-11.0-linux-x64-v8.0.3.33.tgz

完成解压后将会得到一个CUDA文件夹

将里面的lib64与include复制到您之前安装CUDA的目录中去

之后输入

代码语言:javascript
复制
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

如看到以下输出 则代表安装成功

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、安装显卡驱动
  • 1.配置基础环境
    • 1.1、禁用nouveau
    • 2.安装依赖
    • 3.安装显卡驱动
    • 二、安装CUDA
      • 2、配置环境变量
        • 3、验证CUDA是否安装成功
        • 三、安装CUDNN
        相关产品与服务
        GPU 云服务器
        GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档