有奖捉虫:云通信与企业服务文档专题,速来> HOT
GPU 计算型实例能够提供强大的计算能力,从容应对高实时、高并发的海量计算场景,广泛适用于深度学习、科学计算等 GPU 通用计算场景。腾讯云 GPU 云服务器以和 云服务器 CVM 一致的管理方式,提供快速、稳定、弹性的计算服务。

适用场景

适用于 AI 计算、高性能计算场景,例如:
AI 计算
深度学习推理
深度学习训练
科学计算/高性能计算
流体动力学
分子建模
气象工程
地震分析
基因组学等
说明
若您的 GPU 实例用于 3D 图形渲染任务,则建议您使用已配置 vDWS/vWS License 并安装 GRID driver 的 渲染型实例,以此免除手动配置 GPU 图形图像处理基础环境步骤。

计算型实例总览

GPU 云服务器计算型系列提供以下实例:
售卖情况
实例
GPU 类型
可用镜像
可用区域
主售
NVIDIA A10
CentOS 7.2 及以上
Ubuntu 16.04 - 20.04
Windows Server 2016 及以上
广州、上海、北京
NVIDIA A100 NVLink 40G
广州、上海、北京、南京
GN10Xp
NVIDIA Tesla V100 NVLink 32G
CentOS 7.2 及以上
Ubuntu 14.04 - 20.04
Windows Server 2012 及以上
广州、上海、北京、南京、成都、重庆、新加坡、孟买、硅谷、法兰克福
GN7
NVIDIA Tesla T4
广州、上海、南京、北京、成都、重庆、香港、新加坡、曼谷、雅加达、孟买、首尔、东京、硅谷、弗吉尼亚、法兰克福、圣保罗
GN7vi
NVIDIA Tesla T4
CentOS 7.2 - 7.9
Ubuntu 14.04 - 20.04
上海、南京
PTX1
腾讯紫霄C100
TencentOS Server
广州、上海、南京
在售
PNV4ne
NVIDIA A10
CentOS 7.2 及以上
Ubuntu 16.04 - 20.04
Windows Server 2012 及以上
TencentOS Server
上海
NVIDIA Tesla T4
CentOS 7.2 及以上
Ubuntu 14.04 - 20.04
Windows Server 2012 及以上
广州、上海、北京、南京、成都、重庆
NVIDIA Tesla V100 NVLink 32G
广州、上海、北京、南京、成都、重庆、新加坡、硅谷、法兰克福、孟买
NVIDIA Tesla P40
广州、上海、北京、成都、重庆、香港、硅谷
NVIDIA Tesla P4
GN6:成都
GN6S:广州、上海、北京
说明
可用区域:精确到城市级,细分区域详见下文中的实例配置信息。

计算型实例选型推荐

腾讯云提供了类型丰富的 GPU 计算实例,可满足不同业务应用场景的需求。请参考下表,并结合实际需求选择合适的计算实例。
GPU 云服务器计算型实例选型推荐如下表,其中 为支持, 为推荐。
功能\\实例
PNV4
GT4
GN10Xp
GN7
GN7vi
PNV4ne
GI3X
GN10X
GN8
GN6/GN6S
PTX1
图形图像处理
-
-
视频编解码
-
-
深度学习训练
-
深度学习推理
科学计算
-
-
-
-
-
-
-
-
注意
以上推荐用途仅供参考,请根据实际需要进行选择。
NVIDIA 系列 GPU 实例如用作通用计算,则需安装 Tesla Driver + CUDA,安装方法请参考 安装 NVIDIA Tesla 驱动指引安装 CUDA 驱动指引
NVIDIA 系列 GPU 实例如用作 3D 图形渲染任务(高性能图形处理,视频编解码等),则需安装 GRID Driver 和配置 License Server,安装方法请参考 安装 NVIDIA GRID 驱动

支持范围

支持在 私有网络 中启动。
支持与 负载均衡 等产品的业务对接,不增加额外的管理和运维成本,内网流量免费。

实例规格

计算型 PNV4

计算型 PNV4 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库

可用区

PNV4 实例支持可用区为:广州七区、上海四/五区、北京六区。

硬件规格

CPU:2.55GHz AMD EPYCTM Milan 处理器,睿频3.5GHz。
GPU:NVIDIA® A10(31.2 TFLOPS 单精度浮点计算,250 INT8 TOPS,500 INT4 TOPS)。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
PNV4 实例提供以下配置:
型号
GPU (NVIDIA A10)
GPU 显存 (GDDR6)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
PNV4.7XLARGE116
1颗
1 * 24GB
28核
116GiB
13Gbps
230万
28
PNV4.14XLARGE232
2颗
2 * 24GB
56核
232GiB
25Gbps
470万
48
PNV4.28XLARGE466
4颗
4 * 24GB
112核
466GiB
50Gbps
950万
48
PNV4.56XLARGE932
8颗
8 * 24GB
224核
932GiB
100Gbps
1900万
48

计算型 GT4

计算型 GT4 适用于深度学习、科学计算等 GPU 通用计算场景。

适用场景

GT4 具有强大的双精度浮点运算能力,适用于大规模深度学习训练、推理和科学计算场景。例如:
深度学习
高性能数据库
计算流体动力学
计算金融
地震分析
分子建模
基因组学及其他

可用区

GT4 实例支持可用区为:广州三/四/六区、上海四/五区、北京五/六区、南京一区。

硬件规格

CPU:GT4 配置 AMD EPYC™ ROME 处理器,主频2.6GHz。
GPU:NVIDIA® A100 NVLink 40GB(19.5TFLOPS单精度浮点计算,9.7TFLOPS双精度浮点计算,600GB/s NVLink)。
内存:DDR4,内存计算性能稳定。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:最高可支持50Gbps内网带宽,超高网络收发包能力,实例网络性能与规格对应。公网网络 可按需配置。
GT4 实例提供以下配置:
型号
GPU (NVIDIA A100 NVLink 40G)
GPU 显存 (HBM2)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
GT4.4XLARGE96
1颗
1 * 40GB
16核
96GiB
5Gbps
120万
4
GT4.8XLARGE192
2颗
2 * 40GB
32核
192GiB
10Gbps
235万
8
GT4.20XLARGE474
4颗
4 * 40GB
82核
474GiB
25Gbps
600万
16
GT4.41XLARGE948
8颗
8 * 40GB
164核
948GiB
50Gbps
1200万
32
说明
GPU 驱动:NVIDIA A100 系列需要安装 NVIDIA Tesla 450 版本以上驱动,推荐您安装 460.32.03(Linux)/461.33(Windows) 版本驱动,驱动版本信息请参见 NVIDIA 官方文档

计算型 GN10Xp

计算型 GN10Xp 不仅适用于深度学习、科学计算等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

GN10Xp 具有强大的双精度浮点运算能力 ,适用于如下场景:
大规模深度学习训练,推理和科学计算场景。例如:
深度学习
高性能数据库
计算流体动力学
计算金融
地震分析
分子建模
基因组学及其他
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库

可用区

GN10Xp 实例支持可用区为:广州三/四区、上海二/三区、南京一/三区、北京四/五/七区、成都一区、重庆一区、新加坡一区、孟买二区、硅谷二区、法兰克福一区。

硬件规格

CPU:GN10Xp 配置 Intel® Xeon® Platinum 8255C CPU,主频2.5GHz。
GPU:NVIDIA® Tesla® V100 NVLink 32GB(15.7TFLOPS 单精度浮点计算,7.8TFLOPS 双精度浮点计算,125TFLOPS Tensor Core 深度学习加速,300GB/s NVLink)。
内存:DDR4,内存速率达2666MT/s。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN10Xp 实例提供以下配置:
型号
GPU (NVIDIA Tesla V100 NVLink 32G)
GPU 显存 (HBM2)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
GN10Xp.2XLARGE40
1颗
1 * 32GB
10核
40GiB
3Gbps
80万
2
GN10Xp.5XLARGE80
2颗
2 * 32GB
20核
80GiB
6Gbps
150万
5
GN10Xp.10XLARGE160
4颗
4 * 32GB
40核
160GiB
12Gbps
250万
10
GN10Xp.20XLARGE320
8颗
8 * 32GB
80核
320GiB
24Gbps
490万
16

计算型 GN7

NVIDIA 实例 GN7 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库

可用区

GN7 实例支持可用区为:广州三/四/六/七区、上海二/三/四/五区、南京一/二/三区、北京三/五/六/七区、成都一区、重庆一区、香港二区、新加坡一/二/三区、曼谷二区、雅加达二区、孟买二区、首尔一/二区、东京二区、硅谷二区、法兰克福一区、弗吉尼亚二区、圣保罗一区。

硬件规格

CPU:Intel® Xeon® Platinum 8255C CPU,主频 2.5 GHz。
GPU:NVIDIA® Tesla® T4(8.1 TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
内存:DDR4,内存速率达2666MT/s。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN7 实例提供以下配置:
型号
GPU (NVIDIA Tesla T4)
GPU 显存 (DDR6)
vCPU
内存 (DDR4)
内网带宽
网络收发包 (PPS)
队列数
GN7.2XLARGE32
1颗
1 * 16GB
8核
32GiB
3Gbps
60万
8
GN7.5XLARGE80
1颗
1 * 16GB
20核
80GiB
7Gbps
140万
10
GN7.8XLARGE128
1颗
1 * 16GB
32核
128GiB
10Gbps
240万
16
GN7.10XLARGE160
2颗
2 * 16GB
40核
160GiB
13Gbps
280万
20
GN7.20XLARGE320
4颗
4 * 16GB
80核
320GiB
25Gbps
560万
32

视频增强型 GN7vi

NVIDIA 实例 GN7vi 是在 GN7 基础上配置腾讯自研的明眸视频融合 AI 技术,包括极速高清编解码引擎和画质增强工具包,适用于点播、直播场景。使用该实例,您可在实例内部使用腾讯云自研的极速高清编解码和 AI画质增强功能。
说明
如果您希望了解更多 GPU 视频增强型 GN7vi 产品信息,请前往 使用咨询 页面提供联系方式,我们将会有专人联系您。

可用区

GN7vi 实例支持可用区为:上海二/三/四/五区、南京一/二区。

硬件规格

CPU:Intel® Xeon® Platinum 8255C CPU,主频2.5GHz。
GPU:NVIDIA® Tesla® T4(8.1TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
内存:DDR4 ,内存速率达2666MT/s。
存储: 可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN7vi 实例提供以下配置:
型号
GPU (NVIDIA Tesla T4)
GPU 显存 (HBM2)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
GN7vi.5XLARGE80
1颗
1 * 16GB
20核
80GiB
6Gbps
140万
20
GN7vi.10XLARGE160
2颗
2 * 16GB
40核
160GiB
13Gbps
280万
32
GN7vi.20XLARGE320
4颗
4 * 16GB
80核
320GiB
25Gbps
560万
32

计算型 PNV4ne

计算型 PNV4ne 适用于深度学习、科学计算等 GPU 通用计算场景,支持EFI(Elastic Fabric Interface)。
说明:
该实例现处于内测阶段,如需使用,请前往 计算型 PNV4ne 内测申请 页面。

适用场景

性价比高 ,适用于深度学习的推理和小规模训练场景:
大规模部署的 AI 推理
深度学习小规模训练

可用区

PNV4ne 实例支持可用区为:上海五区

硬件规格

CPU:2.55GHz AMD EPYCTM Milan 处理器,睿频3.5GHz。
GPU:NVIDIA® A10(31.2 TFLOPS 单精度浮点计算,250 INT8 TOPS,500 INT4 TOPS)。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。支持EFI(Elastic Fabric Interface)。
说明:
您可以在VPC网络下实现RDMA直通加速互联。EFI的使用说明,请参见使用EFI。如需使用,请前往EFI内测申请页面。
PNV4ne 实例提供以下配置:
型号
GPU (NVIDIA A10)
GPU 显存 (GDDR6)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
PNV4ne.14XLARGE106
1颗
1 * 24GB
56核
106GiB
25Gbps
470万
48
PNV4ne.28XLARGE212
2颗
2 * 24GB
112核
212GiB
50Gbps
950万
48
PNV4ne.56XLARGE424
4颗
4 * 24GB
224核
424GiB
100Gbps
1900万
48

推理型 GI3X

NVIDIA 实例 GI3X 适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库

可用区

GI3X 实例支持可用区为:广州三区、上海四/五区、南京一/二区、北京五/六区、成都一区、重庆一区。

硬件规格

CPU:2.6GHz AMD EPYC™ ROME 处理器,睿频3.3GHz。
GPU:NVIDIA® Tesla® T4(8.1 TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
内存:搭配八通道 DDR4,内存计算性能稳定。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GI3X 实例提供以下配置:
型号
GPU (NVIDIA Tesla T4)
GPU 显存 (GDDR6)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
GI3X.8XLARGE64
1 颗
1 * 16GB
32核
64GiB
5Gbps
140万
8
GI3X.22XLARGE226
2颗
2 * 16GB
90核
226GiB
13Gbps
375万
16
GI3X.45XLARGE452
4颗
4 * 16GB
180核
452GiB
25Gbps
750万
32

计算型 GN10X

计算型 GN10X 不仅适用于深度学习、科学计算等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

GN10X具有强大的双精度浮点运算能力 ,适用于如下场景:
大规模深度学习训练,推理和科学计算场景。例如:
深度学习
高性能数据库
计算流体动力学
计算金融
地震分析
分子建模
基因组学及其他
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库

可用区

GN10X 实例支持可用区为:广州三/四区、上海二/三区、南京一区、北京四/五/七区、成都一区、重庆一区、新加坡一区、硅谷二区、法兰克福一区、孟买二区。

硬件规格

CPU:GN10X 配置 Intel® Xeon® Gold 6133 CPU,主频2.5GHz。
GPU:NVIDIA® Tesla® V100 NVLink 32GB(15.7TFLOPS 单精度浮点计算,7.8TFLOPS 双精度浮点计算,125TFLOPS Tensor Core 深度学习加速,300GB/s NVLink)。
内存:DDR4,内存速率达2666MT/s。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN10X 实例提供以下配置:
型号
GPU (NVIDIA Tesla V100 NVLink 32G)
GPU 显存 (HBM2)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
GN10X.2XLARGE40
1颗
1 * 32GB
8核
40GiB
3Gbps
80万
2
GN10X.9XLARGE160
4颗
4 * 32GB
36核
160GiB
13Gbps
250万
9
GN10X.18XLARGE320
8颗
8 * 32GB
72核
320GiB
25Gbps
490万
16

计算型 GN8

NVIDIA 实例 GN8 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

适用于如下场景:
深度学习的推理和训练场景。例如:
大吞吐量的 AI 推理
深度学习
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库

可用区

GN8 实例支持可用区为:广州三区、北京二/四区、成都一区、香港二区、上海三区、重庆一区、硅谷一区。

硬件规格

CPU:Intel® Xeon® E5-2680 v4 CPU,主频2.4GHz。
GPU:NVIDIA® Tesla® P40(12TFLOPS 单精度浮点计算,47INT8 TOPS)。
内存:DDR4,内存速率达2666MT/s。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN8 实例提供以下配置:
型号
GPU(NVIDIA Tesla P40)
GPU 显存 (HBM2)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
GN8.LARGE56
1颗
24GB
6核
56GiB
1.5Gbps
45万
8
GN8.3XLARGE112
2颗
48GB
14核
112GiB
2.5Gbps
50万
8
GN8.7XLARGE224
4颗
96GB
28核
224GiB
5Gbps
70万
14
GN8.14XLARGE448
8颗
192GB
56核
448GiB
10Gbps
70万
28

计算型 GN6/GN6S

NVIDIA 实例 GN6/GN6S 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库

可用区

GN6/GN6S 实例支持可用区为:
GN6:成都一区。
GN6S:广州三区、上海二,三,四区、北京四,五区。

硬件规格

CPU:GN6 配置 Intel® Xeon® E5-2680 v4 CPU,主频2.4GHz。GN6S 配置 Intel® Xeon® Silver 4110 CPU,主频2.1GHz。
GPU:NVIDIA® Tesla® P4(5.5TFLOPS 单精度浮点计算,22INT8 TOPS)。
内存:DDR4,内存速率达2666MT/s。
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN6/GN6S 实例提供以下配置:
型号
GPU (NVIDIA Tesla P4)
GPU 显存 (HBM2)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
GN6.7XLARGE48
1颗
8GB
28核
48GiB
5Gbps
120万
14
GN6.14XLARGE96
2颗
16GB
56核
96GiB
10Gbps
120万
28
GN6S.LARGE20
1颗
8GB
4核
20GiB
5Gbps
50万
8
GN6S.2XLARGE40
2颗
16GB
8核
40GiB
9Gbps
80万
8

NPU 计算型 PTX1

PTX1 适用于深度学习推理计算,在 CV、OCR、ASR 等场景有良好的性能表现。
注意:
该实例暂时处于白名单开放状态,请您通过 售前在线咨询 进行实例购买权限开通。

适用场景

性价比高,适用于深度学习推理场景。例如:
大规模部署的 AI 推理
图像识别
文字识别
语音识别

可用区

PTX1 实例支持可用区为:广州七区、上海二/五区、南京三区。

硬件规格

CPU:2.55GHz AMD EPYCTM Milan 处理器,睿频3.5GHz。
NPU:腾讯紫霄C100(120 TFLOPS FP16)
存储:可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
网络:最高可支持100Gbps内网带宽,超高网络收发包能力,实例网络性能与规格对应。公网网络 可按需配置。
PTX1 实例提供以下配置:
型号
GPU (腾讯紫霄C100)
GPU 显存 (HBM2e)
vCPU
内存 (DDR4)
内网带宽
网络收发包(PPS)
队列数
PTX1.7XLARGE116
1颗
16GB
28核
116GiB
13Gbps
230万
28
PTX1.14XLARGE232
2颗
32GB
56核
232GiB
25Gbps
470万
48
PTX1.28XLARGE464
4颗
64GB
112核
464GiB
50Gbps
950万
48
PTX1.56XLARGE928
8颗
128GB
224核
928GiB
100Gbps
1900万
48