NVIDIA 系列实例

最近更新时间:2020-06-23 14:21:17

NVIDIA 系列 GPU 实例 GN* 能够提供强大的计算能力,从容应对高实时、高并发的海量计算场景。不仅适用于深度学习、科学计算等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。腾讯云 GPU 云服务器以和 云服务器 CVM 一致的管理方式,提供快速、稳定、弹性的计算服务。

NVIDIA 系列实例总览

NVIDIA 系列实例包括计算型和渲染型两类。其中:

  • 渲染型:适用于 3D 渲染、视频编解码、CAD 等。
  • 计算型:适用于深度学习、科学计算、CAE 等。

GPU 云服务器 NVIDIA 系列提供以下实例:

类型 实例
(NVIDIA)
GPU 类型 GPU 性能 可用区域
计算型 GN10X/GN10Xp Tesla V100 NVLink 32G
  • 15.7TFLOPS 单精度浮点计算
  • 7.8TFLOPS 双精度浮点计算
  • 125TFLOPS Tensor Core 深度学习加速
  • 300GB/s NVLink
  • GN10X:广州、上海、南京、北京、成都、重庆、新加坡、硅谷
  • GN10Xp:广州、上海、南京、北京、成都、重庆
GN8 Tesla P40
  • 12TFLOPS 单精度浮点计算
  • 47INT8 TOPS
香港、广州、上海、北京、成都、重庆、硅谷
GN7 Tesla T4
  • 8.1TFLOPS 单精度浮点计算
  • 130INT8 TOPS
  • 260INT4 TOPS
广州、上海、南京、北京、成都、重庆、新加坡、硅谷
GN6/GN6S Tesla P4
  • 5.5TFLOPS 单精度浮点计算
  • 22INT8 TOPS
  • GN6:成都
  • GN6S:广州、上海、北京
GN2 Tesla M40
  • 7TFLOPS 单精度浮点计算(GPU Boost 加速)
  • 0.2TFLOPS 双精度浮点计算
广州、北京、上海
渲染型 GN7vw Tesla T4
  • 8.1TFLOPS 单精度浮点计算
  • 130INT8 TOPS
  • 260INT4 TOPS
-
说明:

可用区域:精确到城市级,细分区域详见下文中的实例配置信息。

NVIDIA 系列选型推荐

腾讯云提供了类型丰富的 GPU 计算实例,可满足不同业务应用场景的需求。请参考下表,并结合实际需求选择合适的计算实例。

GPU 云服务器 NVIDIA 系列选型推荐如下表,其中 为支持, 为推荐。

功能\实例 GN2 GN6/GN6S GN7 GN8 GN10X/GN10Xp GN7vw
图形图像处理 -
视频编解码
深度学习训练 -
深度学习推理 -
科学计算 - - - -
说明:

GN2 视频编解码支持 H.264,不支持 H.265。详情请参见 视频编码和解码 GPU 支持列表

图形图像处理

推荐使用 GN7vw,免除了 vDWS License 申请及搭建服务器步骤,是图形图像处理应用场景的首选。目前 GN7vw 处于内测阶段,如需使用,请前往 申请 页面。

NVIDIA GN* 系列其他实例(GN2 除外)可以通过安装 GRID Driver 的方式来支持图形图像处理,但是需要额外购买 License,详情请参见 安装 NVIDIA GRID 驱动

视频编解码

推荐使用 GN7 实例。GN7 采用 T4 GPU,性能好且单路视频转码成本最低,适用于视频编解码的产品。

深度学习训练

推荐使用 GN8/GN10X/GN10Xp 实例。 GN8/GN10X 实例采用 P40、V100 中高端 GPU,具有强大的单精度浮点运算能力,并具备较大的 GPU 板载内存,是深度学习训练的首选。

深度学习推理

推荐使用 GN6/GN6S/GN7/GN8 实例。GN6/GN6S/GN7/GN8 实例采用 P4、T4、P40 GPU,具备 INT8 计算能力,性价比高 ,适合大规模部署。

科学计算

推荐使用 GN10X/GN10Xp 实例。GN10X/GN10Xp 实例采用 V100 GPU,具有强大的双精度浮点运算能力,可为科学与工程计算相关的应用软件提供最好的加速能力。

注意:

  • 以上推荐用途仅供参考,请根据实际需要进行选择。
  • NVIDIA 系列 GPU 实例如用作通用计算,则需安装 Tesla Driver + CUDA,安装方法请参考 安装 NVIDIA Tesla 驱动指引安装 CUDA 驱动指引
  • NVIDIA 系列 GPU 实例如用作 3D 图形渲染任务(高性能图形处理,视频编解码等),则需安装 GRID Driver 和配置 License Server,安装方法请参考 安装 NVIDIA GRID 驱动

支持范围

计算型 GN10X/GN10Xp

NVIDIA 实例 GN10X/GN10Xp 不仅适用于深度学习、科学计算等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

GN10X/GN10Xp 具有强大的双精度浮点运算能力 ,适用于如下场景:

  • 大规模深度学习训练,推理和科学计算场景。例如:
    • 深度学习
    • 高性能数据库
    • 计算流体动力学
    • 计算金融
    • 地震分析
    • 分子建模
    • 基因组学及其他
  • 图形图像处理场景。例如:
    • 图形图像处理
    • 视频编解码
    • 图形数据库

硬件规格

  • CPU: GN10X 配置 Intel® Xeon® Gold 6133 CPU,主频2.5GHz。GN10Xp 配置 Intel® Xeon® Platinum 8255C CPU,主频2.5GHz。
  • GPU: NVIDIA® Tesla® V100 NVLink 32GB(15.7TFLOPS 单精度浮点计算,7.8TFLOPS 双精度浮点计算,125TFLOPS Tensor Core 深度学习加速,300GB/s NVLink)。
  • 内存: DDR4 ,内存带宽达2666MT/s。
  • 存储: 可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
  • 网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。

GN10X/GN10Xp 实例提供以下配置:

型号 GPU
(NVIDIA
Tesla V100 NVLink 32G)
GPU 显存
(HBM2)
vCPU 内存
(DDR4)
内网带宽 网络收发包 队列数 可用区
GN10X.2XLARGE40 1颗 1 * 32GB 8核 40GB 4Gbps 80万PPS 2 广州三、四区,上海二、三区,南京一区,北京四、五区,成都一区,重庆一区,新加坡一区,硅谷二区。
GN10X.9XLARGE160 4颗 4 * 32GB 36核 160GB 13Gbps 250万PPS 9
GN10X.18XLARGE320 8颗 8 * 32GB 72核 320GB 25Gbps 490万PPS 16
GN10X.4XLARGE80 2颗 2 * 32GB 18核 80GB 7Gbps 150万PPS 4 广州三、四区,南京一区,成都一区,重庆一区
GN10X.MEDIUM10 1/4颗 8GB vGPU 2核 10GB 1Gbps 20万PPS 2 -
GN10X.LARGE20 1/2颗 16GB vGPU 4核 20GB 2Gbps 40万PPS 2
GN10Xp.2XLARGE40 1颗 1 * 32GB 10核 40GB 4Gbps 80万PPS 10 广州三、四区,上海二区,南京一区,北京五区,成都一区,重庆一区
GN10Xp.5XLARGE80 2颗 2 * 32GB 20核 80GB 7Gbps 150万PPS 16
GN10Xp.10XLARGE160 4颗 4 * 32GB 40核 160GB 13Gbps 250万PPS 16
GN10Xp.20XLARGE320 8颗 8 * 32GB 80核 320GB 25Gbps 490万PPS 16
说明:

vGPU:GN10X 实例簇提供支持 vGPU 的实例类型。目前 vGPU 类型处于内测阶段,如需使用,请前往 申请页面。vGPU 的类型为 vComputeServer,仅支持 CUDA 计算 API。

计算型 GN8

NVIDIA 实例 GN8 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

适用于如下场景:

  • 深度学习的推理和训练场景。例如:
    • 大吞吐量的 AI 推理
    • 深度学习
  • 图形图像处理场景。例如:
    • 图形图像处理
    • 视频编解码
    • 图形数据库

硬件规格

  • CPU: Intel® Xeon® E5-2680 v4 CPU,主频2.4GHz。
  • GPU: NVIDIA® Tesla® P40(12TFLOPS 单精度浮点计算,47INT8 TOPS)。
  • 内存: DDR4 ,内存带宽达2666MT/s。
  • 存储: 可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
  • 网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。

GN8实例提供以下配置:

型号 GPU
(NVIDIA
Tesla P40)
GPU 显存
(GDDR5)
vCPU 内存
(DDR4)
内网带宽 网络收发包 队列数 可用区
GN8.LARGE56 1颗 24GB 6核 56GB 1.5Gbps 45万PPS 6 香港二区,广州三区,上海三区,北京二、四区,成都一区,重庆一区,硅谷一区
GN8.3XLARGE112 2颗 48GB 14核 112GB 2.5Gbps 50万PPS 8
GN8.7XLARGE224 4颗 96GB 28核 224GB 5Gbps 70万PPS 8
GN8.14XLARGE448 8颗 192GB 56核 448GB 10Gbps 70万PPS 8

计算型 GN7

NVIDIA 实例 GN7 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

性价比高 ,适用于如下场景:

  • 深度学习的推理场景和小规模训练场景。例如:
    • 大规模部署的 AI 推理
    • 深度学习小规模训练
  • 图形图像处理场景。例如:
    • 图形图像处理
    • 视频编解码
    • 图形数据库

硬件规格

  • CPU: Intel® Xeon® Platinum 8255C CPU,主频 2.5 GHz。
  • GPU: NVIDIA® Tesla® T4(8.1 TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
  • 内存: DDR4 ,内存带宽达2666MT/s。
  • 存储: 可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
  • 网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。

GN7实例提供以下配置:

型号 GPU
(NVIDIA
Tesla T4)
GPU 显存
(GDDR6)
vCPU 内存
(DDR4)
内网带宽 网络收发包 队列数 可用区
GN7.LARGE20 1/4颗 4GB vGPU 4核 20GB 2Gbps 50万PPS 4 广州三、四区,上海二、四区,南京一、二区,北京三,五区,成都一区,重庆一区,硅谷二区
GN7.2XLARGE40 1/2颗 8GB vGPU 10核 40GB 4Gbps 70万PPS 10
GN7.2XLARGE32 1颗 1 * 16GB 8核 32GB 7Gbps 60万PPS 8 广州三、四区,上海二、四区,南京一、二区,北京三、五区,成都一区,重庆一区,新加坡一区,硅谷二区
GN7.5XLARGE80 1颗 1 * 16GB 20核 80GB 7Gbps 140万PPS 16
GN7.8XLARGE128 1 颗 1 * 16GB 32核 128GB 7Gbps 240万PPS 16
GN7.10XLARGE160 2颗 2 * 16GB 40核 160GB 13Gbps 280万PPS 16
GN7.20XLARGE320 4颗 4 * 16GB 80核 320GB 25Gbps 560万PPS 16
说明:

vGPU:GN7 实例簇支持 vGPU 的实例类型。vGPU 的类型为 vComputeServer,只支持 CUDA 计算 API。

计算型 GN6/GN6S

NVIDIA 实例 GN6/GN6S 不仅适用于深度学习等 GPU 通用计算场景,也适用于图形图像处理(3D 渲染,视频编解码)场景。

适用场景

性价比高 ,适用于如下场景:

  • 深度学习的推理场景和小规模训练场景。例如:
    • 大规模部署的 AI 推理
    • 深度学习小规模训练
  • 图形图像处理场景。例如:
    • 图形图像处理
    • 视频编解码
    • 图形数据库

硬件规格

  • CPU: GN6 配置 Intel® Xeon® E5-2680 v4 CPU,主频2.4GHz。GN6S 配置 Intel® Xeon® Silver 4110 CPU,主频2.1GHz。
  • GPU: NVIDIA® Tesla® P4(5.5TFLOPS 单精度浮点计算,22INT8 TOPS)。
  • 内存: DDR4 ,内存带宽达2666MT/s。
  • 存储: 可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
  • 网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。

GN6/GN6S实例提供以下配置:

型号 GPU
(NVIDIA
Tesla P4)
GPU 显存
(GDDR5)
vCPU 内存
(DDR4)
内网带宽 网络收发包 队列数 可用区
GN6.7XLARGE48 1颗 8GB 28核 48GB 5Gbps 120万PPS 16 成都一区
GN6.14XLARGE96 2颗 16GB 56核 96GB 10Gbps 120万PPS 16
GN6S.LARGE20 1颗 8GB 4核 20GB 7Gbps 50万PPS 2 广州三区,上海二、三、四区,北京四、五区
GN6S.2XLARGE40 2颗 16GB 8核 40GB 13Gbps 80万PPS 2

计算型 GN2

NVIDIA 实例 GN2 适用于深度学习、科学计算等 GPU 通用计算场景,也部分适用于图形图像处理(视频编解码)场景。

适用场景

适用于深度学习训练,推理和科学计算场景。例如:

  • 深度学习
  • 高性能数据库
  • 计算流体动力学
  • 计算金融
  • 地震分析
  • 分子建模
  • 基因组学及其他

部分适用于图形图像处理。例如,视频编解码,支持 H.264,不支持 H.265。详情请参见 视频编码和解码 GPU 支持列表

硬件规格

  • CPU: Intel® Xeon® E5-2680 v4 (Broadwell),主频2.4GHz 。
  • GPU: NVIDIA® Tesla® M40(GPU Boost加速下单精度浮点计算7TFLOPS,0.2TFLOPS 双精度浮点计算)。
  • 内存: DDR4 ,内存带宽达2666MT/s。
  • 存储: 本地 SSD 硬盘,本机型暂不支持购买云硬盘。
  • 网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。

GN2实例提供以下配置:

型号 GPU
(NVIDIA
Tesla M40)
GPU 显存
(GDDR5)
vCPU 内存
(DDR4)
内网带宽 网络收发包 队列数 可用区
GN2.7XLARGE48 1颗 24GB 28核 48GB 5Gbps 40万PPS 8 广州三区,北京二区,上海二区
GN2.14XLARGE96 2颗 48GB 56核 96GB 10Gbps 70万PPS 8
GN2.7XLARGE56 1颗 24GB 28核 56GB 5Gbps 40万PPS 8 广州三区,北京二区,上海二区
GN2.14XLARGE112 2颗 48GB 56核 112GB 10Gbps 70万PPS 8

渲染型 GN7vw

NVIDIA 实例 GN7vw 是在 GN7 基础上配置 vDWS License 服务器并安装 GRID driver 的渲染型实例,适用于图形图像处理(3D 渲染,视频编解码)场景。使用该实例,您可免除手动配置 GPU 图形图像处理基础环境。

注意:

  • GPU 渲染型 GN7vw 现处于内测阶段,目前仅提供试用版 vDWS License。如需使用,请前往 申请 页面。
  • 切换正式版本前,会进行通知(邮件、短信、站内信等方式),请您关注。切换到正式版本后,需要您使用适配的镜像重装实例的操作系统,以适应新版本中 GRID 驱动。

适用场景

适用于图形图像处理。例如:

  • 图形图像处理
  • 视频编解码
  • 图形数据库

硬件规格

  • CPU: Intel® Xeon® Platinum 8255C CPU,主频 2.5 GHz。
  • GPU: NVIDIA® Tesla® T4(8.1 TFLOPS 单精度浮点计算,130 INT8 TOPS,260 INT4 TOPS)。
  • 内存: DDR4 ,内存带宽达2666MT/s。
  • 存储: 可选择 云硬盘类型,如需 扩容 可新建弹性云盘进行挂载。
  • 网络: 默认网络优化,实例网络性能与规格对应。公网网络 可按需配置。

GN7vw实例提供以下配置:

型号 GPU
(NVIDIA
Tesla T4)
GPU 显存
(GDDR6)
vCPU 内存
(DDR4)
内网带宽 网络收发包 队列数 可用区
GN7vw.LARGE16 1/4颗 4GB vGPU 4核 16GB 2Gbps 50万PPS 4 -
GN7vw.2XLARGE32 1/2颗 8GB vGPU 8核 32GB 4Gbps 80万PPS 8
GN7vw.4XLARGE64 1颗 1 * 16GB 16核 64GB 7Gbps 150万PPS 16
说明:

vGPU:GN7、GN7vw 实例簇提供支持 vGPU 的实例类型。其中 GN7vw vGPU 的类型为 vDWS,仅支持 DirectX 和 OpenGL 等图形 API。

目录