前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >史上最完整的GPU卡Tensonflow性能横向评测

史上最完整的GPU卡Tensonflow性能横向评测

作者头像
GPUS Lady
发布2019-03-07 13:05:36
2.6K0
发布2019-03-07 13:05:36
举报
文章被收录于专栏:GPUS开发者GPUS开发者

本篇来自:

评测之前,作者带领大家回顾了一下RTX Titan的优点:

1.RTX Titan具有良好的fp32和fp16计算性能。它的特点类似于RTX 2080Ti,但它有两倍的内存和更好的性能。

2.24GB的显存带来了一些新的可能性,

  • 更大批量的深度学习任务。这可以在某些情况下提高性能并改进收敛性。
  • 输入具有大量特征的数据,例如较大的图像。
  • 拥有更多的显存有助于避免在各种情况下出现可怕的OOM(内存不足)信息。
  • RTX Titan上更大的显存可能是其最好的计算特性。有时候,显存不够是“作秀终结者”。GPU显存很贵,所以我觉得RTX Titan对于一张24GB的显卡来说价格相当合理。类似的(但更好的)RTX Quadro 6000拥有24GB内存,比RTX Titan贵2倍以上。

当然作者也提出了几处弱点:

1.多个RTX TitanGPU卡有散热的问题;这个问题跟RTX2080ti类似:

2. RTX Titan跟RTX2080ti一样,也不支持P2P Access;

3. RTX Titan双精度能力不好

长话短说,我们来看一下测试报告:

硬件环境:

  • Intel Xeon-W 2175 14-core
  • 128GB Memory
  • 1TB Samsung NVMe M.2
  • GPU卡

软件环境:

  • Ubuntu 18.04
  • NVIDIA display driver 410.79 (from CUDA install)
  • CUDA 10.0 Source builds of,
    • p2pBandwidthLatencyTest
  • TensorFlow 1.10 and 1.4
  • Docker 18.06.1-ce
  • NVIDIA-Docker 2.0.3
  • NVIDIA NGC container registry
  • Container image: nvcr.io/nvidia/tensorflow:18.09-py3 for "Big LSTM"
  • Container image: nvcr.io/nvidia/tensorflow:18.03-py2 linked with NCCL and CUDA 9.0 for milti-GPU "CNN"

[ResNet-50] - GTX 1080Ti, RTX 2070, 2080, 2080Ti, Titan V and RTX Titan - using TensorFlow, Training performance (Images/second)

"Big LSTM" - GTX 1080Ti, RTX 2070, RTX 2080, RTX 2080Ti, Titan V and RTX Titan - TensorFlow - Training performance (words/second)

注意作者有话要说:

RTX 2070和2080只有8GB内存,作者不得不将批处理大小降低到256,以避免出现“内存不足”错误。1080Ti和RTX 2080Ti采用批量448。批量大小640用于RTX Titan。

无论出于什么原因,Titan V的结果比预期的要差。这是TensorFlow 1.10,链接到运行NVIDIA的LSTM模型代码的CUDA 10。RTX 2080Ti性能非常好!

作者在Titan V上使用TensorFlow 1.4和CUDA 9.0连接重新运行了“big-LSTM”作业,得到的结果与他以前看到的一致。对于新版本的“big-LSTM”的放缓,他没有任何解释。

那么RTX Titan是否是适合用于深度学习的GPU卡呢?

作者的观点如下:

  1. RTX Titan因为散热的问题,超过两张卡以上不建议;
  2. RTX Titan非常适合单个GPU配置。24GB的内存将允许开发人员处理没有它就很难或不可能解决的问题。对于需要这种能力和性能的多gpu系统,推荐RTX Quardo 6000。这张Quadro卡有相同的内存,它启用了P2P对PCIe,而且它的散热设计很棒。RTX Quadro唯一的缺点是成本。
  3. 总的来说,所有的RTX GPU都是非常好的计算设备。对于机器学习工作负载,它们相较于基于“Pascal”的GTX GPU具有更好的性能,并添加了“tensor -core”。RTX GPU也是创新的!在计算之外,我希望看到开发人员如何使用这些卡片的光线跟踪功能。

以上观点仅代表作者。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-02-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • [ResNet-50] - GTX 1080Ti, RTX 2070, 2080, 2080Ti, Titan V and RTX Titan - using TensorFlow, Training performance (Images/second)
  • "Big LSTM" - GTX 1080Ti, RTX 2070, RTX 2080, RTX 2080Ti, Titan V and RTX Titan - TensorFlow - Training performance (words/second)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档