本篇来自:
评测之前,作者带领大家回顾了一下RTX Titan的优点:
1.RTX Titan具有良好的fp32和fp16计算性能。它的特点类似于RTX 2080Ti,但它有两倍的内存和更好的性能。
2.24GB的显存带来了一些新的可能性,
- 更大批量的深度学习任务。这可以在某些情况下提高性能并改进收敛性。
- 输入具有大量特征的数据,例如较大的图像。
- 拥有更多的显存有助于避免在各种情况下出现可怕的OOM(内存不足)信息。
- RTX Titan上更大的显存可能是其最好的计算特性。有时候,显存不够是“作秀终结者”。GPU显存很贵,所以我觉得RTX Titan对于一张24GB的显卡来说价格相当合理。类似的(但更好的)RTX Quadro 6000拥有24GB内存,比RTX Titan贵2倍以上。
当然作者也提出了几处弱点:
1.多个RTX TitanGPU卡有散热的问题;这个问题跟RTX2080ti类似:
2. RTX Titan跟RTX2080ti一样,也不支持P2P Access;
3. RTX Titan双精度能力不好
长话短说,我们来看一下测试报告:
硬件环境:
- Intel Xeon-W 2175 14-core
- 128GB Memory
- 1TB Samsung NVMe M.2
- GPU卡
软件环境:
- Ubuntu 18.04
- NVIDIA display driver 410.79 (from CUDA install)
- CUDA 10.0 Source builds of,
- TensorFlow 1.10 and 1.4
- Docker 18.06.1-ce
- NVIDIA-Docker 2.0.3
- NVIDIA NGC container registry
- Container image: nvcr.io/nvidia/tensorflow:18.09-py3 for "Big LSTM"
- Container image: nvcr.io/nvidia/tensorflow:18.03-py2 linked with NCCL and CUDA 9.0 for milti-GPU "CNN"
[ResNet-50] - GTX 1080Ti, RTX 2070, 2080, 2080Ti, Titan V and RTX Titan - using TensorFlow, Training performance (Images/second)
"Big LSTM" - GTX 1080Ti, RTX 2070, RTX 2080, RTX 2080Ti, Titan V and RTX Titan - TensorFlow - Training performance (words/second)
注意作者有话要说:
RTX 2070和2080只有8GB内存,作者不得不将批处理大小降低到256,以避免出现“内存不足”错误。1080Ti和RTX 2080Ti采用批量448。批量大小640用于RTX Titan。
无论出于什么原因,Titan V的结果比预期的要差。这是TensorFlow 1.10,链接到运行NVIDIA的LSTM模型代码的CUDA 10。RTX 2080Ti性能非常好!
作者在Titan V上使用TensorFlow 1.4和CUDA 9.0连接重新运行了“big-LSTM”作业,得到的结果与他以前看到的一致。对于新版本的“big-LSTM”的放缓,他没有任何解释。
那么RTX Titan是否是适合用于深度学习的GPU卡呢?
作者的观点如下:
- RTX Titan因为散热的问题,超过两张卡以上不建议;
- RTX Titan非常适合单个GPU配置。24GB的内存将允许开发人员处理没有它就很难或不可能解决的问题。对于需要这种能力和性能的多gpu系统,推荐RTX Quardo 6000。这张Quadro卡有相同的内存,它启用了P2P对PCIe,而且它的散热设计很棒。RTX Quadro唯一的缺点是成本。
- 总的来说,所有的RTX GPU都是非常好的计算设备。对于机器学习工作负载,它们相较于基于“Pascal”的GTX GPU具有更好的性能,并添加了“tensor -core”。RTX GPU也是创新的!在计算之外,我希望看到开发人员如何使用这些卡片的光线跟踪功能。
以上观点仅代表作者。