前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >原来你是这样的GPU卡|NVIDIA发布新一代Titan系列:Titan RTX

原来你是这样的GPU卡|NVIDIA发布新一代Titan系列:Titan RTX

作者头像
GPUS Lady
发布2018-12-24 16:38:24
4.9K0
发布2018-12-24 16:38:24
举报
文章被收录于专栏:GPUS开发者GPUS开发者

今天,NVIDIA发布了目前世界上最强大的桌面GPU卡—— Titan RTX™,该卡采用NVIDIA 图灵™架构,可提供130 Tflops 深度学习计算性能和11 GigaRays光线追踪性能。

NVIDIA TITAN RTX功能亮点:

  • 576个多精度Turing Tensor Cores,提供高达130万亿次的深度学习性能。
  • 72个Turing RT Cores,每秒提供多达11 GigaRays实时光线跟踪性能。
  • 24GB高速GDDR6内存,672GB/s带宽——是上一代泰坦gpu卡显存的两倍——以适应更大的模型和数据集。
  • 100GB/s NVIDIA NVLink可以对两个TITAN RTX gpu实现显存和计算能力的扩张。
  • 难以置信的性能和内存带宽可以实现实时8K视频编辑。
  • VirtualLink™接口提供了所需的性能和连接下一代VR耳机。

第三方媒体提供了一个规格比较图:

那么问题来了,到底该选择怎样的GPU卡用于深度学习?

RTX2080ti跟Titan RTX都采用了TU102芯片,但是比2080Ti多了256个SP (或者说都是TU102,但是2080Ti屏蔽了一些SP),比2080Ti占优势的一个最大亮点是——24GB大显存!以前双11GB显存的2080Ti 上NVLink是为了什么!现在直接双倍显存还多。价格2499美元,比买2个2080ti还便宜。

不过Titan RTX双精度计算能力很渣,看来Titan-V还能再战斗一段时间。

第三方媒体还公布了一个图来展现图灵架构Tensor Core的性能关系:

注意:Titan V没有NVLink ,没有二代的Tensor Core (INT8和INT4的巨大加速),显存容量还不如人家,唯一优势就是双精度计算,不过Titan-V是HBM(HBM2实际上),这显存省电的很。

网上有人测试过说2080Ti的Tensor Core,在FP16计算的时候,如果最后是累加FP32的话,只有一半性能。纯FP16计算2080Ti无此问题。而纯FP16,和FP16/FP32混合精度,Titan RTX都没这个问题。比较符合上图所描绘的情况。如果这个情况是属实,家用卡的RTX系列,Tensor Core被限定了在混合精度计算的时候,性能只有1/2的话,深度学习的开发者就真的只能用专业卡或者Titan RTX 。关于这一点我们目前还没有机会拿到这两种卡做测试。

总结:

(1)NV现在主要靠显存容量区分了。Titan RTX适合需要大容量显存的应用场合。

(2)相比之前的Titan-V,Titan RTX支持NVLink。这应该是目前能买到的比较实际的,能聚合成48GB总容量的卡了。(2080Ti才能聚合成22GB,而Titan-V不能聚合)

(3)计算性能几乎没啥增长。对于需要强力计算性能的人来说,可以考虑继续使用RTX 2080Ti的卡,就慢一点点。

(4)网上有谣传说是RTX 2080 Ti屏蔽掉了Tensor Core在特定情况下的1/2的计算性能。而Titan RTX无此影响。

(5)因为计算性能无增长(几乎),游戏玩家,以前玩不动的光追游戏,现在依然玩不动。可以继续等待下一代的卡。

(6)Titan RTX没有双精度,也没有低功耗的HBM2显存。是一个遗憾。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档