黄仁勋在GTC上带来什么惊喜?除了TensorRT 3,还有英伟达在自动驾驶的最新动向

AI科技评论按:今年是英伟达 GTC(GPU 技术大会)在中国举办的第二年。在 AI 革命势头正劲之际,英伟达创始人兼 CEO 黄仁勋亮相北京。据了解,为期三天的 GTC 盛会将吸引超过 3500 名科学家、工程师和媒体参加。

首日的英伟达GPU技术峰会上,由英伟达创始人兼CEO黄仁勋宣布了一系列重要消息,包括新版神经网络推理加速器TensorRT 3,与国内OEM厂商联合推出基于 Tesla V100 的 HGX-1 加速器,此外还有更多关于自动驾驶的新动态。本文将围绕英伟达 TensorRT 3 与自动驾驶领域的最近进展做详细介绍。

TensorRT 3

在英伟达GPU技术峰会上,黄仁勋正式发布TensorRT 3 神经网络推理加速器。据官方介绍,TensorRT 3能极大改善处理性能,削减从云到边缘设备(自动驾驶汽车、机器人等)的推理开销。TensorRT 3 是在Volta GPU 实现最优推理性能的关键,比起CPU它能实现高达40倍的吞吐量,时延在7ms之内。目前,对于英伟达开发者计划成员,现在有针对Tesla GPU (P4, P100, V100)和Jetson嵌入式平台的TensorRT 3提供免费下载。

英伟达TensorRT 是一种高性能神经网络推理引擎,用于在生产环境中部署深度学习应用程序。应用有图像分类,分割和目标检测,提供的帧/秒速度比只有CPU的推理引擎高14倍。

TensorRT是世界上第一款可编程推理加速器,能加速现有和未来的网络架构,TensorRT可编译到广泛的目标CUDA GPU中,从120 TOPS到1 TOPS,从250瓦到低于1瓦。

它包含一个为优化在生产环境中部署的深度学习模型而创建的库,可获取经过训练的神经网络(通常使用 32 位或 16 位数据),并针对降低精度的 INT8 运算来优化这些网络。

为何TensorRT 3有着无可比拟的地位,他提到了以下几点:

  • 一是网络设计呈爆发性增长:AI推理平台必须具备可编程性才能运行种类繁多且不断演进的网络架构;新的架构、更深的网络、新的分层设计会继续提升CNN的性能。
  • 二是智能机器呈爆发性增长:AI会将智能诸如到2000万台云服务器、上亿台汽车和制造机器人中;最终,以万亿计的物联网设备和传感器将智能地监测一切,从心率和血压监测,到需维修设备的震动监测;AI推理平台必须可扩展,以解决海量计算的性能、公号和成本需求。

TensorRT 3新的亮点如下:

  • 相较Tesla P100,在Tesla V100上能实现3.7倍的加速,时延在7ms之内
  • 在Tesla V100上进行优化和配置TensorFlow模型时,比起TensorFlow框架能实现18倍的推理加速
  • 轻松使用Python API接口,生产力得到极大改进

据黄仁勋现场介绍,

TensorRT3的性能非常卓越,运行在Volta上的TensorRT3在图像分类方面比最快的CPU还要快40倍,在语言翻译方面则要快140倍。

另外,现场他还提到,神经网络的响应时间或处理延时会对服务质量造成直接影响,运行在V100上的TensorRT在处理图像是可实现7ms的延时,在处理语音是延时不到200ms,这是标准云服务的理想目标,单靠CPU是无法实现的。

TensorRT3能支持Caffe2、mxnet、PaddlePaddle、Pytorch、TensorFlow、theano、Chainer等所有的深度学习框架,将TensorRT 3和英伟达的GPU结合起来,能在所有的框架中进行超快速和高效的推理传输,支持图像和语言识别、自然语言处理、可视化搜索和个性化推荐等AI服务。

自动驾驶新惊喜

在演讲中,黄仁勋提到,现在已是计算新纪元,包括TensorRT在内的NVIDIA多个平台已被BAT等多家科技巨头采用:

  • 目前,NVIDIA TensorRT已经被BAT、科大讯飞、京东所采用;
  • 除了 TensorRT,NVIDIA Tesla V100 AI平台已被BAT、华为、浪潮和联想在内的中国领军IT公司采用;
  • NVIDIA AI 城市平台已被阿里巴巴、海康威视、大华和华为所采用,以解决最大规模的AI和推理难题之一;

那么在自动驾驶领域,黄仁勋又带来了哪些新惊喜呢?

145 家自动驾驶合作伙伴

在今年的 GTC 中国站,英伟达在自动驾驶领域的朋友圈又扩大了。

英伟达 CEO 黄仁勋宣布:通过最前沿的深度学习和计算机视觉计算机,英伟达可以让新兴的初创公司设计新的算法和软件。这其中,已经有 145 家初创公司正在研制基于 NVIDIA DRIVE 的自动驾驶汽车、卡车、高清制图以及服务。

与此同时,另外一个重磅消息是,英伟达 GPU Ventures 战略投资了由前百度自动驾驶事业部总经理王劲创办的自动驾驶公司景驰。

据雷锋网了解,在这一轮融资汇总,景驰获得 5200 万美元资金,由启明创投、华创资本和包括英伟达 GPU Ventures 在内的其他机构及个人参与联合投资。

英伟达在 GPU Ventures Program 下已投公司超过 25 家,横跨 AI、生命科学、自动驾驶、VR等领域

自 2015 年后,英伟达的投资主要聚焦在两个方向:应用 GPU 进行大规模数据处理的公司与应用 GPU 研发自动驾驶技术的公司。

围绕这两个方向,尤其是在自动驾驶领域,英伟达投资了不少这一类型的公司。

据公开消息显示,在今年 8 月,英伟达战略投资了另外一家来自中国的自动驾驶初创公司图森未来,前者在此次投资后持有 3% 后者的股份。更早之前,英伟达还投资了匈牙利 AImotive 和来自美国硅谷的 Drive.ai。

开放的自动驾驶平台:NVIDIA DRIVE

黄仁勋在演讲中表示,英伟达 NVIDIA DRIVE 是一个为自动驾驶行业带来变革的端到端平台。

汽车厂商将训练汽车 AI,共享和车队服务将训练 AI 用于管理车队,自动驾驶计算机可以支持 Level 3、Level 4 和 Level 5 级别的自动驾驶。

这个开放软件栈包含了 ASIL-D OS(Drive OS)、深度学习(Drive PX)、计算机视觉 SDK (Driveworks SDK)到自动驾驶的应用 Drive AV。

需要指出的是,Drive AV 是英伟达开发的自动驾驶应用。这一应用围绕摄像头、雷达和激光雷达的传感数据融合,多种深度学习和计算机视觉算法将为 Level 4、Level 5 级别自动驾驶技术提供所需的多样性和冗余性。英伟达的合作伙伴则能利用这一平台的所有或部分特征。

黄仁勋表示,NVIDIA DRIVE 自动驾驶计算平台支持 Level 3 到 Level5 级别的自动驾驶,并达到 ASIL-D (汽车安全完整性等级最高等级)功能安全。

Perception(感知,利用雷达、激光雷达和其他传感器感知周围环境)、Location(定位)、Planning(规划,比如如何行车变换车道)是自动驾驶三大核心要素。在现场,英伟达展示了这个自动驾驶平台的效果(如上图)。

在今年 5 月的 GTC 大会上,英伟达向外界阐释了自动驾驶计算平台各产品线的定位:

  • Drive PX 2:单个处理器性能可实现 Level 2 到 Level 3 级别自动驾驶,多个 Drive PX 2 的并行使用可实现 Level 4 到 Level 5 级别的自动驾驶。
  • Drive PX Xavier:单个处理器可实现 Level 4 到 Level 5 级别自动驾驶。

关于 Xavier ,在今天(9 月 26 日),黄仁勋宣布了这个「全球首款自主机器处理器」的进展。这款「复杂的片上系统」可用于仿真、训练和自动驾驶。据雷锋网了解,Xavier 将于 2018 年第一季度向部分合作伙伴提供样品,计划在 2018 年第四季度推向市场。

截至今年 5 月 GTC 大会的统计,与英伟达就自动驾驶解决方案达成合作的公司达到了 225 家。除了汽车厂商、零部件供应商、互联网公司(百度)和图商(TomTom,HERE)外,还有技术公司。在自动驾驶领域,围绕 GPU 和深度学习,英伟达完成了一系列布局。

今年 GTC 上另一个亮点是,AirBus 依靠英伟达计算平台打造的 AirBus 飞行汽车——这是双方正在进行的一个实际项目。

这辆飞行汽车分为三部分:底盘、车厢和自动飞行的机翼。「将来,你只需要点击手机上的 App,机翼就会过来接你,带你自动飞行到另一个地点。」黄仁勋在现场表示。

黄仁勋认为,自动驾驶的发明将是 AI 最大的贡献之一,自动驾驶将催生新的出租车服务,帮助卡车司机减轻压力,增加运输距离并减少事故。自动驾驶甚至能改变车辆的形态,在飞机和汽车之间使用自动驾驶技术,汽车和飞机的边界将会变得模糊。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-09-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【20 亿美元赌注】英伟达推出深度学习芯片,人工智能进入主流时代

【新智元导读】芯片是整个智能产业的发动机,也是市场成熟度的关键指标,而且计算能力飞速发展,芯片制造商必须要在几年之内获得相应的市场回报。GPU巨头企业NVIDI...

2958
来自专栏新智元

【英伟达成为谷歌的对手】谷歌 TPU 第二代PK英伟达胜算几何?

【新智元导读】随着谷歌推出第二代既能推理又能训练的 TPU 芯片,搜索巨头和 AI 芯片商英伟达势必要决出高下。智能时代,英伟达和谷歌的前景如何?The Mot...

4005
来自专栏大数据文摘

刚刚,英伟达发布全球最强AI训练器HGX-2,可替换300个CPU服务器

922
来自专栏量子位

Waymo为防无人车撞伤行人又开新脑洞:柔性汽车外壳

陈桦 编译自 TheVerge 量子位 报道 | 公众号 QbitAI ? △ 这个车已经进博物馆了,这里只是示意图 可能是为了让人民群众放心,现在的自动驾驶程...

3427
来自专栏量子位

李嘉诚首投AI芯片:华人创办公司Kneron耐能,已发3款NPU

672
来自专栏新智元

对标谷歌TPU,比特大陆第一代深度学习专用处理器全球首发

【新智元导读】人工智能时代,中国芯无论是技术还是市场都越来越精彩,继谷歌TPU之后,中国数字货币独角兽比特大陆,在今天的AI WORLD 2017世界人工智能大...

3428
来自专栏量子位

英伟达发布全球最大GPU:性能提升10倍,售价250万

DGX-2能够实现每秒2千万亿次浮点运算(2 PFLOPS),性能比去年9月推出的DGX-1性能提高了10倍,售价39.9万美元(人民币250万元)。

975
来自专栏吉浦迅科技

NVIDIA GPU大幅领先AI时代 英特尔、AMD尾随追赶

NVIDIA已经远非昔日刻板印象中一家小型的GPU处理器供应商,在执行长黄仁勋的带领转型下,如今已经跃居独立型GPU(discrete GPU)市场的领跑者,更...

3127
来自专栏大数据文摘

CEO工资高得离谱?一项全球调研揭秘真相

1734
来自专栏大数据文摘

拿着锤子找钉子,数字芯片领导者比特大陆进军人工智能

1973

扫描关注云+社区