GPU 计算型实例能够提供强大的计算能力,从容应对高实时、高并发的海量计算场景,广泛适用于深度学习、科学计算等 GPU 通用计算场景。腾讯云 GPU 云服务器以和 云服务器 CVM 一致的管理方式,提供快速、稳定、弹性的计算服务。
说明:
若您的 GPU 实例用于 3D 图形渲染任务,则建议您使用已配置 vDWS/vWS License 并安装 GRID driver 的 渲染型实例,以此免除手动配置 GPU 图形图像处理基础环境步骤。
计算型实例总览
GPU 云服务器计算型系列提供以下实例:
售卖情况 | 实例 | GPU 类型 | 售卖地域 |
主售 | NVIDIA A10 | 广州、上海、南京、北京 | |
| NVIDIA A100 | 广州、上海、南京、北京 | |
| NVIDIA V100 | 广州、上海、南京、北京、成都、重庆、新加坡、曼谷、孟买、首尔、东京、法兰克福、硅谷 | |
| NVIDIA T4 | 广州、上海、南京、北京、成都、重庆、香港、新加坡、曼谷、雅加达、孟买、首尔、东京、法兰克福、硅谷、弗吉尼亚、圣保罗 | |
| NVIDIA T4 | 上海、南京 | |
| 腾讯紫霄C100 | 广州、上海、南京 | |
在售 | NVIDIA T4 | 广州、上海、南京、北京、成都、重庆 | |
| NVIDIA V100 | 广州、上海、南京、北京、成都、重庆、新加坡、孟买、法兰克福、硅谷 | |
| NVIDIA P40 | 广州、上海、北京、成都、重庆、香港、硅谷 | |
| NVIDIA P4 | GN6:成都 GN6S:广州、上海、北京 |
计算型实例选型推荐
腾讯云提供了类型丰富的 GPU 计算实例,可满足不同业务应用场景的需求。请参考下表,并结合实际需求选择合适的计算实例。
GPU 云服务器计算型实例选型推荐如下表,其中 ✓ 为支持,★ 为推荐。
功能\\实例 | PNV4 | GT4 | GN10Xp | GN7 | GN7vi | GI3X | GN10X | GN8 | GN6/GN6S | PTX1 |
图形图像处理 | ✓ | - | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | - |
视频编解码 | ✓ | - | ✓ | ★ | ★ | ★ | ✓ | ✓ | ✓ | - |
深度学习训练 | ✓ | ★ | ★ | ✓ | ✓ | ✓ | ★ | ★ | ✓ | - |
深度学习推理 | ★ | ✓ | ★ | ★ | ★ | ★ | ★ | ✓ | ✓ | ★ |
科学计算 | - | ★ | ★ | - | - | - | ★ | - | - | - |
注意:
以上推荐用途仅供参考,请根据实际需要进行选择。
NVIDIA 系列 GPU 实例如用作通用计算,则需安装 Tesla Driver + CUDA,安装方法请参见 安装 NVIDIA Tesla 驱动指引 和 安装 CUDA 驱动指引。
NVIDIA 系列 GPU 实例如用作 3D 图形渲染任务(高性能图形处理,视频编解码等),则需安装 GRID Driver 和配置 License Server,安装方法请参见 安装 NVIDIA GRID 驱动。
实例规格
计算型 PNV4
计算型 PNV4 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。
适用场景
性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库
硬件规格
GPU:NVIDIA® A10 (FP32 31.2 TFLOPS, TF32 62.5 TFLOPS, FP16 125 TFLOPS, INT8 250 TOPS)。
CPU:2.55GHz AMD EPYCTM Milan 处理器,睿频3.5GHz。
内存:搭配八通道 DDR4 内存。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
PNV4.7XLARGE116 | NVIDIA A10 * 1 | 24GB * 1 | 28 | 116 | 13 | 230万 | 28 |
PNV4.14XLARGE232 | NVIDIA A10 * 2 | 24GB * 2 | 56 | 232 | 25 | 470万 | 48 |
PNV4.28XLARGE466 | NVIDIA A10 * 4 | 24GB * 4 | 112 | 466 | 50 | 950万 | 48 |
PNV4.56XLARGE932 | NVIDIA A10 * 8 | 24GB * 8 | 224 | 932 | 100 | 1900万 | 48 |
计算型 GT4
计算型 GT4 适用于深度学习、科学计算等 GPU 通用计算场景。
适用场景
GT4 具有强大的双精度浮点运算能力,适用于大规模深度学习训练、推理和科学计算场景。例如:
深度学习
高性能数据库
计算流体动力学
计算金融
地震分析
分子建模
基因组学及其他
硬件规格
GPU:NVIDIA® A100 NVLink 40GB (FP64 9.7 TFLOPS, FP32 19.5 TFLOPS, 600GB/s NVLink)。
CPU:2.6GHz AMD EPYCTM ROME 处理器,睿频3.3GHz。
内存:搭配八通道 DDR4 内存。
网络:最高可支持50Gbps内网带宽,超高网络收发包能力,实例网络性能与规格对应。公网网络 可按需配置。
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包(PPS) | 队列数 |
GT4.4XLARGE96 | NVIDIA A100 * 1 | 40GB * 1 | 16 | 96 | 5 | 120万 | 4 |
GT4.8XLARGE192 | NVIDIA A100 * 2 | 40GB * 2 | 32 | 192 | 10 | 235万 | 8 |
GT4.20XLARGE474 | NVIDIA A100 * 4 | 40GB * 4 | 82 | 474 | 25 | 600万 | 16 |
GT4.41XLARGE948 | NVIDIA A100 * 8 | 40GB * 8 | 164 | 948 | 50 | 1200万 | 32 |
说明:
计算型 GN10Xp
计算型 GN10Xp 不仅适用于深度学习、科学计算等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。
适用场景
GN10Xp 具有强大的双精度浮点运算能力 ,适用于如下场景:
大规模深度学习训练,推理和科学计算场景。例如:
深度学习
高性能数据库
计算流体动力学
计算金融
地震分析
分子建模
基因组学及其他
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库
硬件规格
CPU:GN10Xp 配置 Intel® Xeon® Platinum 8255C CPU,主频2.5GHz。
GPU:NVIDIA® Tesla® V100 NVLink 32GB (15.7TFLOPS 单精度浮点计算,7.8TFLOPS 双精度浮点计算,125TFLOPS Tensor Core 深度学习加速,300GB/s NVLink)。
内存:DDR4,内存速率达2666MT/s。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
GN10Xp.2XLARGE40 | NVIDIA V100 * 1 | 32GB * 1 | 10 | 40 | 3 | 80万 | 2 |
GN10Xp.5XLARGE80 | NVIDIA V100 * 2 | 32GB * 2 | 20 | 80 | 6 | 150万 | 5 |
GN10Xp.10XLARGE160 | NVIDIA V100 * 4 | 32GB * 4 | 40 | 160 | 12 | 250万 | 10 |
GN10Xp.20XLARGE320 | NVIDIA V100 * 8 | 32GB * 8 | 80 | 320 | 24 | 490万 | 16 |
计算型 GN7
NVIDIA 实例 GN7 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。
适用场景
性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库
硬件规格
CPU:Intel® Xeon® Platinum 8255C CPU,主频 2.5 GHz。
GPU:NVIDIA® Tesla® T4(8.1 TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
内存:DDR4,内存速率达2666MT/s。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
GN7.2XLARGE32 | NVIDIA T4 * 1 | 16GB * 1 | 8 | 32 | 3 | 60万 | 8 |
GN7.5XLARGE80 | NVIDIA T4 * 1 | 16GB * 1 | 20 | 80 | 7 | 140万 | 10 |
GN7.8XLARGE128 | NVIDIA T4 * 1 | 16GB * 1 | 32 | 128 | 10 | 240万 | 16 |
GN7.10XLARGE160 | NVIDIA T4 * 2 | 16GB * 2 | 40 | 160 | 13 | 280万 | 20 |
GN7.20XLARGE320 | NVIDIA T4 * 4 | 16GB * 4 | 80 | 320 | 25 | 560万 | 32 |
视频增强型 GN7vi
NVIDIA 实例 GN7vi 是在 GN7 基础上配置腾讯自研的明眸视频融合 AI 技术,包括极速高清编解码引擎和画质增强工具包,适用于点播、直播场景。使用该实例,您可在实例内部使用腾讯云自研的极速高清编解码和 AI画质增强功能。
说明:
硬件规格
CPU:Intel® Xeon® Platinum 8255C CPU,主频2.5GHz。
GPU:NVIDIA® Tesla® T4(8.1 TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
内存:DDR4 ,内存速率达2666MT/s。
网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
GN7vi.5XLARGE80 | NVIDIA T4 * 1 | 16GB * 1 | 20 | 80 | 6 | 140万 | 20 |
GN7vi.10XLARGE160 | NVIDIA T4 * 2 | 16GB * 2 | 40 | 160 | 13 | 280万 | 32 |
GN7vi.20XLARGE320 | NVIDIA T4 * 4 | 16GB * 4 | 80 | 320 | 25 | 560万 | 32 |
推理型 GI3X
NVIDIA 实例 GI3X 适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。
适用场景
性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库
硬件规格
CPU:2.6GHz AMD EPYCTM ROME 处理器,睿频3.3GHz。
GPU:NVIDIA® Tesla® T4(8.1 TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
内存:搭配八通道 DDR4,内存计算性能稳定。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GI3X 实例提供以下配置:
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
GI3X.8XLARGE64 | NVIDIA T4 * 1 | 16GB * 1 | 32 | 64 | 5 | 140万 | 8 |
GI3X.22XLARGE226 | NVIDIA T4 * 2 | 16GB * 2 | 90 | 226 | 13 | 375万 | 16 |
GI3X.45XLARGE452 | NVIDIA T4 * 4 | 16GB * 4 | 180 | 452 | 25 | 750万 | 32 |
计算型 GN10X
计算型 GN10X 不仅适用于深度学习、科学计算等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。
适用场景
GN10X具有强大的双精度浮点运算能力 ,适用于如下场景:
大规模深度学习训练,推理和科学计算场景。例如:
深度学习
高性能数据库
计算流体动力学
计算金融
地震分析
分子建模
基因组学及其他
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库
硬件规格
CPU:GN10X 配置 Intel® Xeon® Gold 6133 CPU,主频2.5GHz。
GPU:NVIDIA® Tesla® V100 NVLink 32GB(15.7TFLOPS 单精度浮点计算,7.8TFLOPS 双精度浮点计算,125TFLOPS Tensor Core 深度学习加速,300GB/s NVLink)。
内存:DDR4,内存速率达2666MT/s。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN10X 实例提供以下配置:
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
GN10X.2XLARGE40 | NVIDIA V100 * 1 | 32GB * 1 | 8 | 40 | 3 | 80万 | 2 |
GN10X.4XLARGE80 | NVIDIA V100 * 2 | 32GB * 2 | 18 | 80 | 7 | 150万 | 4 |
GN10X.9XLARGE160 | NVIDIA V100 * 4 | 32GB * 4 | 36 | 160 | 13 | 250万 | 9 |
GN10X.18XLARGE320 | NVIDIA V100 * 8 | 32GB * 8 | 72 | 320 | 25 | 490万 | 16 |
计算型 GN8
NVIDIA 实例 GN8 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。
适用场景
适用于如下场景:
深度学习的推理和训练场景。例如:
大吞吐量的 AI 推理
深度学习
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库
硬件规格
CPU:Intel® Xeon® E5-2680 v4 CPU,主频2.4GHz。
GPU:NVIDIA® Tesla® P40(12TFLOPS 单精度浮点计算,47INT8 TOPS)。
内存:DDR4,内存速率达2666MT/s。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN8 实例提供以下配置:
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
GN8.LARGE56 | NVIDIA P40 * 1 | 24GB * 1 | 6 | 56 | 1.5 | 45万 | 8 |
GN8.3XLARGE112 | NVIDIA P40 * 2 | 24GB * 2 | 14 | 112 | 2.5 | 50万 | 8 |
GN8.7XLARGE224 | NVIDIA P40 * 4 | 24GB * 4 | 28 | 224 | 5 | 70万 | 14 |
GN8.14XLARGE448 | NVIDIA P40 * 8 | 24GB * 8 | 56 | 448 | 10 | 70万 | 28 |
计算型 GN6/GN6S
NVIDIA 实例 GN6/GN6S 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。
适用场景
性价比高 ,适用于如下场景:
深度学习的推理场景和小规模训练场景。例如:
大规模部署的 AI 推理
深度学习小规模训练
图形图像处理场景。例如:
图形图像处理
视频编解码
图形数据库
硬件规格
CPU:GN6 配置 Intel® Xeon® E5-2680 v4 CPU,主频2.4GHz。GN6S 配置 Intel® Xeon® Silver 4110 CPU,主频2.1GHz。
GPU:NVIDIA® Tesla® P4(5.5TFLOPS 单精度浮点计算,22INT8 TOPS)。
内存:DDR4,内存速率达2666MT/s。
网络:默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。
GN6/GN6S 实例提供以下配置:
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
GN6.7XLARGE48 | NVIDIA P4 * 1 | 8GB * 1 | 28 | 48 | 5 | 120万 | 14 |
GN6.14XLARGE96 | NVIDIA P4 * 2 | 8GB * 2 | 56 | 96 | 10 | 120万 | 28 |
GN6S.LARGE20 | NVIDIA P4 * 1 | 8GB * 1 | 4 | 20 | 5 | 50万 | 8 |
GN6S.2XLARGE40 | NVIDIA P4 * 2 | 8GB * 2 | 8 | 40 | 9 | 80万 | 8 |
NPU 计算型 PTX1
PTX1 适用于深度学习推理计算,在 CV、OCR、ASR 等场景有良好的性能表现。
注意:
适用场景
性价比高,适用于深度学习推理场景。例如:
大规模部署的 AI 推理
图像识别
文字识别
语音识别
硬件规格
CPU:2.55GHz AMD EPYCTM Milan 处理器,睿频3.5GHz。
NPU:腾讯紫霄C100(120 TFLOPS FP16)
网络:最高可支持100Gbps内网带宽,超高网络收发包能力,实例网络性能与规格对应。公网网络 可按需配置。
PTX1 实例提供以下配置:
规格 | GPU | GPU 显存 | vCPU | 内存 (GiB) | 内网带宽 (Gbps) | 网络收发包 (PPS) | 队列数 |
PTX1.7XLARGE116 | 腾讯紫霄C100 * 1 | 16GB * 1 | 28 | 116 | 13 | 230万 | 28 |
PTX1.14XLARGE232 | 腾讯紫霄C100 * 2 | 16GB * 2 | 56 | 232 | 25 | 470万 | 48 |
PTX1.28XLARGE464 | 腾讯紫霄C100 * 4 | 16GB * 4 | 112 | 464 | 50 | 950万 | 48 |
PTX1.56XLARGE928 | 腾讯紫霄C100 * 8 | 16GB * 8 | 224 | 928 | 100 | 1900万 | 48 |