英伟达CEO黄仁勋专访 | All IN深度学习自动驾驶,打响芯片热战

【新智元导读】英伟达2016年Q2财报大好,股价创历史新高,从CEO黄仁勋投资人会议发言可以看出,英伟达接下来有向数据中心和自动驾驶发力的迹象,这两者核心还是深度学习。日前英特尔宣布收购初创公司Nervana,CPU巨头终于在深度学习芯片市场与英伟达短兵相交。本文后附华盛顿大学英伟达技术产品报告,用数据告诉你GPU巨头如何深耕深度学习。

上周四,英伟达2016年Q2财报公布,表现超出预期,英伟达股价随后也创下历史新高,不仅如此,市场对英伟达Q3的预期也比原来增加了2亿美元。

英伟达Q2销售额共计14.3亿美元(同比增长24%),每股收入0.4美元(同比增长700%)。其中,GPU销售额比去年同期增长25%,达到12亿美元。

游戏依然是英伟达立足市场的主力,占据总销售额的55%,但相比去年仅实现18%的增长;而数据中心(增长110%)、自动驾驶(增长68%)和专业图像处理(增长22%)这些新业务,增长率明显升高。

全副身家押注深度学习

英伟达在图像处理技术方面一直处于市场领先地位,最近这家公司开拓新领域的决心也得到了华尔街的回应。

CEO黄仁勋在投资人会议上强调,深度学习是英伟达十分重要的增长动力,也是公司一直持续大力投资的领域,“过去5年来,我们一直默默投资深度学习,因为我们相信深度学习未来对整个软件产业、整个计算机产业都有着深远的影响,我们把一切都赌在了深度学习上”。

黄仁勋还指出,英伟达数据中心业务(销售额约1.5亿美元)中,大约有一半都是深度学习系统,这也是得益于公司在深度学习芯片方面的大力投入。

然而,相比英特尔2016年Q2在数据中心40亿美元的盈利,英伟达在数据中心的业务就显得沧海一粟。不过,英特尔数据中心Q2的增长率仅为5%

黄仁勋罕见地在投资人会议上对英特尔的处理给出了极高的赞誉,称英特尔制造的CPU是数据中心最好的CPU,英特尔Xeon系列处理器对大多数数据中心而言,都是不可或缺的。

英特尔上周收购了深度学习初创公司 Nervana Systems,也计划制作深度学习专用芯片。Nervana 由原高通神经网络研发负责人于 2014 年创建,拥有目前最快的深度学习框架,Nervana 预计明年初推出的深度学习专用芯片,号称速度比 GPU 快10倍。对于英伟达来说,英特尔此举显然构成了极大的威胁。

目前看,游戏平台依然是英伟达的核心业务,但这家公司正把未来堵在深度学习和自动驾驶上面,华尔街也对此表示积极观望。

此外,英伟达为自动驾驶汽车开发的芯片也引起了投资人的注意。英伟达Q2在汽车方面的销售额1.19亿美元,主要是车载信息娱乐系统。英伟达使用自己的硬件,结合DriveWorks软件,开发了所谓的限量版“汽车超级计算机”,发货给80多家厂商。英伟达方面有意出货给更多的厂商,但具体时间线还不能确定,可能很快,也可能还需要几年,黄仁勋表示“开发自动驾驶汽车是很浩大的工程”。

英伟达:利用规模优势快速迭代,制造更快的处理器

英伟达CEO黄仁勋在CES上谈论公司在深度学习以及自动驾驶方面的投资。来源:BloombergNews

在投资人会议后,黄仁勋接受了 Venture Beat 记者采访,比较详细地谈了英伟达在 VR、深度学习和自动驾驶方面的策略。

VB:你在会议上说Pascal架构发布很顺利,能具体讲一下细节吗?

黄仁勋:我们在 4 款不同的GPU生产方面大力投入,每一款都比以前更好。一个季度推出4款不同的GPU,4 种不同的16纳米FinFET 处理器,这是前所未有的。我们的GPU也使用了世界上最快的存储器:GP100的HBM2和Titan、1080的G5X。我们还使用了3D堆叠存储器。所有这些都在Pascal架构里面得到了实现。

性能也是全新的。Pacal架构是世界首个拥有多画面投影技术(multi-projection)的图像处理架构,使用了全新的深度学习架构。再考虑到所有这些事情都在一个财报季度里执行实现,我感到非常自豪。

VB:VR业务前景如何?

黄仁勋:你也知道,我们跟VR显示器的关联度是很高的。我们对VR保持密切关注。VR业务前景很好。我所见的一个比较大的意外是英伟达的 Fun House。下载量非常高,很受欢迎。表现很不错。

HTC Vive VR 游戏 Funhouse

VB:对于Pascal架构,你认为促进销售量的是游戏玩家(hardcore gamer)还是VR用户,或者说这两者是同一类人?

黄仁勋:大部分还是游戏玩家。我说过,你也知道——电子游戏产值大幅增长,正因此高端GPU装机量得到了增长。下一代主机Scorpio和Neo发布在即,我也十分期待。主要还是电子游戏产值持续增长。

VB:你以前曾经提到过,VR初创企业整体表现活跃。同样,AI和深度学习初创企业市场也十分兴旺。在你看来这两者的势头哪个更强一些?

黄仁勋:两者势头一样。数量也会持续增长。在生命科学和健康医疗领域有很多AI公司,显然交通运输也有很多。金融科技也不少,还有一些做企业软件的。AI触及的范围正在不断扩大。而VR领域,我们看见有很多触觉(haptics)相关的初创企业。触觉也将成为VR十分重要的一个分领域。

VB:英特尔收购了Nervana。你对跟英特尔在深度学习之间的竞争怎么看?

黄仁勋:我们专注于我们应该做的。我们对产业动态有很好的把握。我们知道市场上都发生了些什么。深度学习应用很广,深度学习产品将得到大规模制造。现实也正是如此。我们知道深度学习架构这种新的计算模型,在并行架构上运行起来会更好。传统的计算机架构需要针对深度学习进行改造。GPU到GPU之间的计算是实现深度学习的一种很好的方法。

我们的方法是在现有GPU架构的基础上不断演化发展,以我们所能做到的最快的速度提升深度学习。我们在规模上有优势,我们也在利用我们在规模上的优势快速迭代,建造更快的处理器。

VB:你认为自动驾驶汽车热潮会发展多快?

黄仁勋:自动驾驶在明年将会得到巨大改善。我期望见到实质性的发展。我预期全世界的公司都开始使用地图技术,在出租车服务方面也有所布局。卡车也变得自动化。接下来一两年就能看到。

英伟达产品技术报告

关注新智元,在公众号首页回复0815,可下载英伟达51页深度学习报告。

英伟达Q2已经交出了一份投资人满意的答卷。那么,面对接下来英特尔介入后的深度学习芯片市场,英伟达又将表现如何呢?

下面是今年 4 月华盛顿大学制作的一份关于英伟达加速计算的报告,从中我们可以窥见这家公司在深度学习技术和产品方面的积累。

英伟达加速计算

四大领域:游戏、PRD可视化、数据中心和自动驾驶

创新驱动:科学计算、机器学习、虚拟现实和无限制访问

英伟达 DGX-1

世界上第一个深度学习超级计算机

专为深度学习设计,为主要AI框架提速

报告目录:

什么是深度学习

GPU和深度学习

实践中的深度学习

什么是深度学习

无处不在的深度学习:

  1. 互联网和云
  2. 医药和生物
  3. 媒体和娱乐
  4. 安全和国防
  5. 自动化的机器

传统的深度学习:手动调节特征

图像、声音和文本

深度学习的路径:训练到部署

人工神经网络:简单的、可训练的数学单元,能集体学习复杂函数

人工神经元

深度神经元网络(DNN)

应用分析:

任务对象:人脸识别

训练数据:10-100M 图像

网络结构:-10层,1B参数

学习算法:-30 Exaflops -30 GPU 门

神经网络更容易扩展:当决策空间是非线性的,特征的数量可以非常大。

深度学习的好处:

鲁棒性:不需要提前设计特征。根据手上的任务,特征可以自动进行优化。数据中自然变量的鲁棒性可以自动学习。

可普及:相同的神经网络方法可以被用于许多不同的应用和数据类型。

可扩展:随着更多的数据和方法可以大规模地并行实施,性能得到提升。

AI竞赛正火热

自动驾驶中的深度学习

百度深度语音:中英语音识别端到端深度学习

准确率超越人类

AlphaGo,第一个在围棋上击败人类的计算机程序。

样本研究流程

GPU和深度学习

使用更多的处理器,以做到更快

数据分析图景:GPU加速了这些大数据应用

机器学习大爆炸:DNN+大数据+GPU

深度学习发展圈

三种类型的网络:DNN(全部联系的层),CNN(一些卷积层),RNN(递归神经网络,LSTM)

DNN:M x V的浓度是关键

DNN:训练批处理,受延迟影响大

CNN:要求卷积和M x V

一个DNN中,有许多可用的平行层

TESLA M40:世界上最快的深度学习训练加速器

CPU和GPU的比较:服务器类

JETSON TX1:嵌入式深度学习

一个架构——端对端的人工智能

Tesla P100 加速器

英伟达DGX-1 :世界上首个深度学习超级计算机

实践中的深度学习

现代AI 的引擎

深度学习发展中的CUDA

英伟达深度学习SDK

cuDNN

CUDA 为基础的深度学习

cuDNN5 有什么新东西? Pascal GPU, RNNs,性能升级

英伟达DIGITS:交互式深度学习GPU训练系统。

英伟达DIGITS:提升深度学习训练的生产力、

展望DIGITS的未来:自动化和国防中的物体识别,目标是自动驾驶汽车和远程感知。

获得DIGITS的方法

英伟达 DIGITS

练手实验室

快速训练和改进DNN

建立一个数据库

找到一个标准的网络,开始训练。比如对图片进行分类

调整网络

增加或移除参数

处理增多的数据

英伟达 DIGITS

练手实验室

  1. 在nvlabs.qwiklab.com上注册账户
  2. 去往深度学习课程基础
  3. 选择“DIGITS 深度学习训练系统介绍”
  4. 点击“开始实验”

无人驾驶汽车中的端对端学习,参见论文http://arxiv.org/abs/1604.07316。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2016-08-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

李理:从Image Caption Generation理解深度学习(part I)

32140
来自专栏新智元

递归神经网络之父:打造无监督式通用神经网络人工智能

【新智元导读】瑞士人工智能实验室IDSIA的科学事务主管Jürgen Schmidhuber 1997年率领团队提出了简化时间递归神经网络的长短期记忆时间递归神...

44350
来自专栏算法+

来源自rnnoise,但非rnn

https://files.cnblogs.com/files/cpuimage/denoise.zip

23730
来自专栏深度学习自然语言处理

资料 |《深度学习500问》,川大优秀毕业生的诚意之作

今天,给大家推荐一本还未完成的深度学习书籍——《深度学习500问》。为什么要推荐一本未完成的书?

12020
来自专栏奇点大数据

AI 换脸技术——DeepFakes 概述(二)

本文由图普科技编译自 Exploring DeepFakes。 相关文章:AI 换脸技术——DeepFakes 概述(一) DeepFakes的“短板” 尽管D...

96770
来自专栏腾讯高校合作

【犀牛鸟·视野】现场报道 | SIGGRAPH Asia 2017 (DAY 2):“图像和显示”session探究

今天是SIGGRAPH Asia 2017的第二天,与昨天稍显冷清的会场相比,今天可谓是百花齐放,热闹非凡,这主要是因为有两大重头戏上演,即各式各样的展台(Ex...

36670
来自专栏人工智能头条

【AI每日播报】周志华最新论文、Redis之父9条忠告、百度又搞了个大新闻

27530
来自专栏新智元

AI和机器学习想取得进展,首先要规范研究报告

【新智元导读】从小有“学术天才”之称的 Kamil Tamiola 将计算生物学和机器学习相结合,组建了自己的创业公司。他表示,当年最痛苦的事情就是“科学写作”...

31560
来自专栏机器之心

业界 | 拿下吴文俊奖,今日头条李磊谈AI如何实现内容创作

38880
来自专栏新智元

【重磅】谷歌量子计算在量子化学领域取得实质突破

【新智元导读】Google Research 今日发文,自上月在 Nature 发文介绍最新通用量子计算机原型后,这一次谷歌研究员和多所高校合作,首次在没有耗费...

41360

扫码关注云+社区

领取腾讯云代金券