文档中心>GPU 云服务器>操作指南>安装 NVIDIA 驱动>安装 Tesla 驱动>创建实例后快速安装 Tesla 驱动-Linux(推荐)

创建实例后快速安装 Tesla 驱动-Linux(推荐)

最近更新时间:2025-04-11 15:45:02

我的收藏

操作场景

GPU 云服务器正常工作需提前安装正确的基础设施软件,对 NVIDIA 系列 GPU 而言,有以下两个层次的软件包需要安装:
驱动 GPU 工作的硬件驱动程序。
上层应用程序所需要的库。
为方便用户使用,购买页提供了多种安装 GPU 驱动及关联 CUDA、cuDNN 的方法。在创建 GPU 实例时,可以根据业务需求选择不同方法完成驱动部署。

安装方式

安装方式
描述
链接
方式一:重装公共镜像时自动安装驱动
在重装系统页面选择镜像步骤,选择公共镜像并勾选后台自动安装 GPU 驱动选项。
方式二:登录实例使用脚本安装 GPU 驱动
登录实例,使用驱动自动安装脚本安装驱动。
方式三:使用 TAT 自动化助手安装驱动
进入控制台,使用 TAT 执行公共命令执行驱动安装脚本
方式四:使用云市场镜像重装系统
在重装系统页面选择镜像步骤,选择预装了 Tesla 驱动的云市场镜像。

方式一:重装公共镜像时自动安装驱动

1. 在云服务器 重装系统 过程中,选择镜像步骤请选择 CentOS、Ubuntu 或 TencentOS 镜像。 选择后即出现后台自动安装 GPU 驱动选项,可按需选择 CUDA 和 cuDNN 版本。如下图所示:



说明:
仅计算型实例部分镜像版本支持 Tesla 驱动自动安装,以重装系统页面展示为准。
2. 其他配置选择请参见 重装系统,配置完成后请前往控制台,找到实例并等待10分钟左右驱动安装完成。
4. 执行以下命令,验证驱动是否安装成功。
nvidia-smi
如返回类似下图中的 GPU 信息,则说明驱动安装成功。




方式二:登录实例使用脚本安装 GPU 驱动

操作步骤

1. 登录 云服务器控制台,选择需要登录的 GPU 云服务器,单击右侧的登录,根据实际需求选择连接方式 登录实例

2. 复制下列命令,参考 参数说明 更新参数后将驱动自动安装脚本保存为 driver_install.sh
cat > driver_install.sh << EOF
#!/bin/bash
sudo rm -f /tmp/user_define_install_info.ini
sudo rm -f /tmp/auto_install.sh
sudo rm -f /tmp/auto_install.log
sudo echo "
DRIVER_VERSION=535.161.07
CUDA_VERSION=12.4.0
CUDNN_VERSION=8.9.7
DRIVER_URL=
CUDA_URL=
CUDNN_URL=
" > /tmp/user_define_install_info.ini
sudo wget https://mirrors.tencentyun.com/install/GPU/auto_install.sh -O /tmp/auto_install.sh && sudo chmod +x /tmp/auto_install.sh && sudo /tmp/auto_install.sh > /tmp/auto_install.log 2>&1 &
EOF
如下图所示:

3. 输入bash driver_install.sh执行脚本。

4. 等待10-20分钟后,验证驱动安装完成。使用nvidia-smi检查驱动安装成功。

输入grep -i "finished" /tmp/auto_install.log查看驱动、CUDA、cuDNN 安装记录:




参数说明

使用驱动自动安装脚本时,支持两种参数指定版本方式:
1. 指定驱动版本号来安装驱动。
2. 指定安装包下载地址安装驱动。
指定驱动版本号来安装驱动
根据创建的实例规格和镜像,参考支持组合范围修改对应的 Tesla 驱动、CUDA 和 cuDNN 库版本参数:
DRIVER_VERSION=535.161.07
CUDA_VERSION=12.4.0
CUDNN_VERSION=8.9.7
DRIVER_URL=
CUDA_URL=
CUDNN_URL=
说明:
仅 NVIDIA 计算型实例部分 Linux 镜像支持 Tesla 驱动安装脚本。
推荐选择最新版本的 Tesla 驱动、CUDA、cuDNN 库。
创建实例后,执行脚本安装耗时约10-20分钟。
支持的机型、镜像、Tesla 驱动、CUDA、cuDNN 组合范围如下:
说明:
下表列举部分实例类型为裸金属云服务器高性能计算集群实例类型。
实例类型
公共镜像
Tesla 驱动版本
CUDA 驱动版本
cuDNN 版本
GT4、PNV4、GN10Xp、GN10X、GN8、GN7、BMG5t、BMG5v、HCCPNV4h、HCCG5v、HCCG5vm、HCCPNV4sn、HCCPNV4sne、HCCPNV5v
TencentOS Server 3.1(TK4)

Ubuntu Server 22.04 LTS 64位
Ubuntu Server 20.04 LTS 64位
550.90.07
12.4.0
8.9.7
GT4、PNV4、GN10Xp、GN10X、GN8、GN7、BMG5t、BMG5v、HCCPNV4h、HCCG5v、HCCG5vm、HCCPNV4sn、HCCPNV4sne、HCCPNV5v
TencentOS Server 3.1(TK4)
TencentOS Server 2.4(TK4)

Ubuntu Server 22.04 LTS 64位
Ubuntu Server 20.04 LTS 64位

CentOS 7.x 64位
CentOS 8.x 64位
535.183.06
535.161.07
12.4.0
8.9.7
535.183.06
535.161.07
12.2.2
8.9.4
GT4、PNV4、GN10Xp、GN10X、GN8、GN7、BMG5t、BMG5v、HCCPNV4h、HCCG5v、HCCG5vm、HCCPNV4sn、HCCPNV4sne、HCCPNV5v
TencentOS Server 3.1(TK4)
TencentOS Server 2.4(TK4)

Ubuntu Server 20.04 LTS 64位
Ubuntu Server 18.04 LTS 64位

CentOS 7.x 64位
CentOS 8.x 64位
525.105.17
12.0.1
8.8.0
GT4、PNV4、GN10Xp、GN10X、GN8、GN7、BMG5t、BMG5v、HCCPNV4h、HCCG5v、HCCG5vm、HCCPNV4sn、HCCPNV4sne
470.182.03
11.4.3
8.2.4
指定安装包下载地址安装驱动
根据创建的实例规格和镜像,参见 英伟达驱动CUDAcuDNN 官网文档 指定对应的 Tesla 驱动、CUDA 和 cuDNN 库版本组合,下载后另存为实例可访问的 URL 地址填入参数:
DRIVER_VERSION=
CUDA_VERSION=
CUDNN_VERSION=
#确保实例可正常下载URL对应安装包
DRIVER_URL=http://mirrors.tencentyun.com/install/GPU/NVIDIA-Linux-x86_64-535.161.07.run
CUDA_URL=http://mirrors.tencentyun.com/install/GPU/cuda_12.4.0_550.54.14_linux.run
#cuDNN建议使用tar.xz、tgz格式安装包
CUDNN_URL=http://mirrors.tencentyun.com/install/GPU/cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
说明:
如果填写 DRIVER_URL、CUDA_URL、CUDNN_URL 的任意一个参数,DRIVER_VERSION、CUDA_VERSION、CUDNN_VERSION 参数将失效。
仅 NVIDIA 计算型实例 Linux 镜像支持 Tesla 驱动安装脚本,可能存在卡型、镜像、GPU 驱动、CUDA 和 cuDNN 库安装包不兼容的风险,推荐您使用指定驱动版本号的方式安装驱动
如果填写非腾讯云内网下载地址,将产生 公网网络费用,且下载时间会更长。

方式三:使用 TAT 自动化助手安装驱动

1. 登录云服务器控制台,选择左侧导航栏中的 自动化助手 > 公共命令
2. 公共命令页面上方选择实例所在地域,并单击安装 GPU 驱动-Linux 系统模块左下角的执行命令。如下图所示:

3. 在执行命令页面,您可修改命令配置,参数配置参见参数说明

4. 勾选需执行命令的 GPU 实例,您可以使用实例类型筛选出 GPU 实例类型:

5. 单击执行命令即可。

方式四:使用云市场镜像重装系统