AI新利器,英伟达推史上最强GPU

8月15日消息,据GamesBeat报道,英伟达表示,随着英伟达图灵图形处理单元(GPU)架构的推出,该公司“重新发明了计算机图形学”。该架构将成为未来一系列图形芯片的基础,这些芯片将专注于实时光线追踪,或高度真实、物理精确的图形。

图:英伟达首席执行官黄仁勋(Jensen Huang)展示10 GigaRay显卡Quadro rtx8000

一、自2006年发明以来的最大飞跃

在加拿大温哥华举行的SIGGRAPH 2018计算机图形与交互技术大会上,英伟达首席执行官黄仁勋(Jensen Huang)发表主题演讲时说,新设计是“CUDA GPU自2006年发明以来的最大飞跃”。该架构可比上代架构快5倍的速度处理图形。图灵的新RT Cores(光线追踪核心)可以加速光线追踪,而新的Tensor Cores(张量核心)可以用于人工智能推理,这两种功能首次结合起来,使实时光线追踪成为可能。

该显卡拥有5000/6000/8000三款RTX,具有16T单精度浮点性能,每秒10G Rays,每秒500T OPs深度学习,支持NVLink,每秒100GB,支持每秒500万亿张量的操作。

其核心面积暴增至754平方毫米,最大显存48GB GDDR6,集成186亿晶体管,显存频率14GHz,可实现硬件加速的AI、光线追踪和仿真。黄仁勋称其为2006以来最大的飞跃。

黄仁勋表示:“这是我们在一代人的时间里所实现的最大一次飞跃。”这两个引擎以及更强大的模拟计算和增强栅格化,开创了新一代的混合渲染功能,以推动该公司所说的2500亿美元视觉效果产业前进。英伟达表示,混合渲染可以实现相当于电影质量的交互体验、由神经网络提供的惊人效果以及高度复杂模型的流体交互。

黄仁勋表示,第一批使用图灵架构的芯片是Nvidia Quadro rtx8000、Quadro rtx6000和Quadro rtx5000 GPU。他说:“图灵架构是英伟达十多年来在计算机图形学领域最重要的创新。混合渲染将改变这个行业,为我们的生活带来更多的美好设计、更丰富的娱乐以及更多的互动体验。实时光线追踪的到来是我们行业的圣杯。”

图灵架构是英伟达第8代GPU架构,它也是第一种光线追踪GPU架构。通过使用图灵的混合渲染功能,应用可以六倍于上一代Pascal的速度模拟物理世界。分析公司JPR首席执行官乔恩·佩迪(Jon Peddie)在声明中称:“这是计算机图形史上的一个重要时刻,英伟达在我们预想的5年前就提供了实时光线追踪。”

图灵架构有专门的光线追踪处理器,称为RT Cores,它加速了光和声音在3D环境中以每秒10 GigaRay速度传播的计算。图灵的实时光线跟踪速度是上一代Pascal的25倍,而GPU节点可以超过CPU节点30倍的速度进行最终帧渲染。

Cinesite首席技术官米歇尔·西奥莱特(Michele Sciolette)表示:“Cinesite很自豪能与Autodesk和英伟达合作,将Arnold引入GPU中,但我们从未期望看到如此戏剧性的结果。这意味着我们可以更快、更频繁、更高质量的设置迭代。这将彻底改变我们的艺术家的工作方式。”

图灵架构还具有Tensor Cores(即人工智能子处理器),它可以加速深度学习训练和推理,每秒可提供500万亿张量操作。这个性能级别支持AI增强的特性,可用于创建具有强大新功能的应用程序。这些包括DLAA (深度学习抗锯齿),这是高质量运动图像生成的突破,其他应用还包括去噪、分辨率缩放和视频调速。基于图灵架构的Quadro GPU将于第四季度上市。

二、什么是光线追踪(Ray-tracing)?

RTX光线追踪技术(ray-tracing)是英伟达在纪念3月GDC上发布新技术 ,它能够完美地计算光线反射、折射、散射等路线,渲染出逼真的画面,几乎与真实世界真假莫辨。

在真实世界中,我们看到的3D物体被光源照亮,且光子可以在到达观看者的眼睛以前从一个物体反弹到另一个物体。光线追踪技术则是反过来,通过从我们的眼睛(观景式照相机)反向追踪光线捕捉这些效果,通过追踪2D视表面上每个像素的光线的路径,并应用到场景的3D模型中。

可想而知,这种技术的计算量非常大,一般渲染复杂的特殊效果可能需要花上几天甚至几周的时间,所以此前该项技术一直仅限于高成本的电影制作中。

不过,随着这款“史上最强GPU”诞生,光线计算开始变得越来越简单,产品设计师、游戏设计师、建筑师们能够在几分钟甚至几秒内生成逼真的产品模型。

三、新一代架构——图灵(Turing)

光线追踪GPU使用的核心架构即是英伟达此次推出的全新架构——图灵(Turing)。

早前6月23日,英伟达在官方推特庆祝计算机之父艾伦·图灵(Alan Turing)的诞辰,当时吃瓜群众就纷纷猜测NV此举在暗示下一代显卡的架构将以“图灵”命名。如今,这一猜测落地成真。

Turning架构提供高达16 TFLOPS+16TIPS的计算性能,拥有4608个CUDA core可实现复杂现实世界的快速物理仿真。该架构将实施光线追踪加速到25倍,速度是CPU的30倍之多。

四、Quadro RTX服务器

在展示基于RTX的Porsche demo后,黄仁勋宣布发布英伟达Quadro RTX服务器(Quadro RTX Server)。该服务器为数据中心的按需渲染制定了新标准,可轻松配置按需渲染节点,以进行批量和交互式渲染。

它将Quadro RTX GPU与明年第一季度将推出新的Quadro Infinity软件相结合,提供强大而灵活的架构,从而满足创意专业人士的需求。Quadro Infinity将允许多个用户通过虚拟工作站访问单个GPU,从而显着提高数据中心的密度。最终用户还可以根据他们的特定需求轻松配置渲染节点和工作站。

Quadro RTX服务器预装了业界领先的内容创建和渲染软件,提供功能强大且易于部署的渲染解决方案,可从小型安装扩展到最大的数据中心,仅占CPU成本的四分之一渲染农场。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180815A1B1US00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券