前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >英伟达CEO黄仁勋专访 | All IN深度学习自动驾驶,打响芯片热战

英伟达CEO黄仁勋专访 | All IN深度学习自动驾驶,打响芯片热战

作者头像
新智元
发布2018-03-23 14:15:52
8370
发布2018-03-23 14:15:52
举报
文章被收录于专栏:新智元新智元

【新智元导读】英伟达2016年Q2财报大好,股价创历史新高,从CEO黄仁勋投资人会议发言可以看出,英伟达接下来有向数据中心和自动驾驶发力的迹象,这两者核心还是深度学习。日前英特尔宣布收购初创公司Nervana,CPU巨头终于在深度学习芯片市场与英伟达短兵相交。本文后附华盛顿大学英伟达技术产品报告,用数据告诉你GPU巨头如何深耕深度学习。

上周四,英伟达2016年Q2财报公布,表现超出预期,英伟达股价随后也创下历史新高,不仅如此,市场对英伟达Q3的预期也比原来增加了2亿美元。

英伟达Q2销售额共计14.3亿美元(同比增长24%),每股收入0.4美元(同比增长700%)。其中,GPU销售额比去年同期增长25%,达到12亿美元。

游戏依然是英伟达立足市场的主力,占据总销售额的55%,但相比去年仅实现18%的增长;而数据中心(增长110%)、自动驾驶(增长68%)和专业图像处理(增长22%)这些新业务,增长率明显升高。

全副身家押注深度学习

英伟达在图像处理技术方面一直处于市场领先地位,最近这家公司开拓新领域的决心也得到了华尔街的回应。

CEO黄仁勋在投资人会议上强调,深度学习是英伟达十分重要的增长动力,也是公司一直持续大力投资的领域,“过去5年来,我们一直默默投资深度学习,因为我们相信深度学习未来对整个软件产业、整个计算机产业都有着深远的影响,我们把一切都赌在了深度学习上”。

黄仁勋还指出,英伟达数据中心业务(销售额约1.5亿美元)中,大约有一半都是深度学习系统,这也是得益于公司在深度学习芯片方面的大力投入。

然而,相比英特尔2016年Q2在数据中心40亿美元的盈利,英伟达在数据中心的业务就显得沧海一粟。不过,英特尔数据中心Q2的增长率仅为5%

黄仁勋罕见地在投资人会议上对英特尔的处理给出了极高的赞誉,称英特尔制造的CPU是数据中心最好的CPU,英特尔Xeon系列处理器对大多数数据中心而言,都是不可或缺的。

英特尔上周收购了深度学习初创公司 Nervana Systems,也计划制作深度学习专用芯片。Nervana 由原高通神经网络研发负责人于 2014 年创建,拥有目前最快的深度学习框架,Nervana 预计明年初推出的深度学习专用芯片,号称速度比 GPU 快10倍。对于英伟达来说,英特尔此举显然构成了极大的威胁。

目前看,游戏平台依然是英伟达的核心业务,但这家公司正把未来堵在深度学习和自动驾驶上面,华尔街也对此表示积极观望。

此外,英伟达为自动驾驶汽车开发的芯片也引起了投资人的注意。英伟达Q2在汽车方面的销售额1.19亿美元,主要是车载信息娱乐系统。英伟达使用自己的硬件,结合DriveWorks软件,开发了所谓的限量版“汽车超级计算机”,发货给80多家厂商。英伟达方面有意出货给更多的厂商,但具体时间线还不能确定,可能很快,也可能还需要几年,黄仁勋表示“开发自动驾驶汽车是很浩大的工程”。

英伟达:利用规模优势快速迭代,制造更快的处理器

英伟达CEO黄仁勋在CES上谈论公司在深度学习以及自动驾驶方面的投资。来源:BloombergNews

在投资人会议后,黄仁勋接受了 Venture Beat 记者采访,比较详细地谈了英伟达在 VR、深度学习和自动驾驶方面的策略。

VB:你在会议上说Pascal架构发布很顺利,能具体讲一下细节吗?

黄仁勋:我们在 4 款不同的GPU生产方面大力投入,每一款都比以前更好。一个季度推出4款不同的GPU,4 种不同的16纳米FinFET 处理器,这是前所未有的。我们的GPU也使用了世界上最快的存储器:GP100的HBM2和Titan、1080的G5X。我们还使用了3D堆叠存储器。所有这些都在Pascal架构里面得到了实现。

性能也是全新的。Pacal架构是世界首个拥有多画面投影技术(multi-projection)的图像处理架构,使用了全新的深度学习架构。再考虑到所有这些事情都在一个财报季度里执行实现,我感到非常自豪。

VB:VR业务前景如何?

黄仁勋:你也知道,我们跟VR显示器的关联度是很高的。我们对VR保持密切关注。VR业务前景很好。我所见的一个比较大的意外是英伟达的 Fun House。下载量非常高,很受欢迎。表现很不错。

HTC Vive VR 游戏 Funhouse

VB:对于Pascal架构,你认为促进销售量的是游戏玩家(hardcore gamer)还是VR用户,或者说这两者是同一类人?

黄仁勋:大部分还是游戏玩家。我说过,你也知道——电子游戏产值大幅增长,正因此高端GPU装机量得到了增长。下一代主机Scorpio和Neo发布在即,我也十分期待。主要还是电子游戏产值持续增长。

VB:你以前曾经提到过,VR初创企业整体表现活跃。同样,AI和深度学习初创企业市场也十分兴旺。在你看来这两者的势头哪个更强一些?

黄仁勋:两者势头一样。数量也会持续增长。在生命科学和健康医疗领域有很多AI公司,显然交通运输也有很多。金融科技也不少,还有一些做企业软件的。AI触及的范围正在不断扩大。而VR领域,我们看见有很多触觉(haptics)相关的初创企业。触觉也将成为VR十分重要的一个分领域。

VB:英特尔收购了Nervana。你对跟英特尔在深度学习之间的竞争怎么看?

黄仁勋:我们专注于我们应该做的。我们对产业动态有很好的把握。我们知道市场上都发生了些什么。深度学习应用很广,深度学习产品将得到大规模制造。现实也正是如此。我们知道深度学习架构这种新的计算模型,在并行架构上运行起来会更好。传统的计算机架构需要针对深度学习进行改造。GPU到GPU之间的计算是实现深度学习的一种很好的方法。

我们的方法是在现有GPU架构的基础上不断演化发展,以我们所能做到的最快的速度提升深度学习。我们在规模上有优势,我们也在利用我们在规模上的优势快速迭代,建造更快的处理器。

VB:你认为自动驾驶汽车热潮会发展多快?

黄仁勋:自动驾驶在明年将会得到巨大改善。我期望见到实质性的发展。我预期全世界的公司都开始使用地图技术,在出租车服务方面也有所布局。卡车也变得自动化。接下来一两年就能看到。

英伟达产品技术报告

关注新智元,在公众号首页回复0815,可下载英伟达51页深度学习报告。

英伟达Q2已经交出了一份投资人满意的答卷。那么,面对接下来英特尔介入后的深度学习芯片市场,英伟达又将表现如何呢?

下面是今年 4 月华盛顿大学制作的一份关于英伟达加速计算的报告,从中我们可以窥见这家公司在深度学习技术和产品方面的积累。

英伟达加速计算

四大领域:游戏、PRD可视化、数据中心和自动驾驶

创新驱动:科学计算、机器学习、虚拟现实和无限制访问

英伟达 DGX-1

世界上第一个深度学习超级计算机

专为深度学习设计,为主要AI框架提速

报告目录:

什么是深度学习

GPU和深度学习

实践中的深度学习

什么是深度学习

无处不在的深度学习:

  1. 互联网和云
  2. 医药和生物
  3. 媒体和娱乐
  4. 安全和国防
  5. 自动化的机器

传统的深度学习:手动调节特征

图像、声音和文本

深度学习的路径:训练到部署

人工神经网络:简单的、可训练的数学单元,能集体学习复杂函数

人工神经元

深度神经元网络(DNN)

应用分析:

任务对象:人脸识别

训练数据:10-100M 图像

网络结构:-10层,1B参数

学习算法:-30 Exaflops -30 GPU 门

神经网络更容易扩展:当决策空间是非线性的,特征的数量可以非常大。

深度学习的好处:

鲁棒性:不需要提前设计特征。根据手上的任务,特征可以自动进行优化。数据中自然变量的鲁棒性可以自动学习。

可普及:相同的神经网络方法可以被用于许多不同的应用和数据类型。

可扩展:随着更多的数据和方法可以大规模地并行实施,性能得到提升。

AI竞赛正火热

自动驾驶中的深度学习

百度深度语音:中英语音识别端到端深度学习

准确率超越人类

AlphaGo,第一个在围棋上击败人类的计算机程序。

样本研究流程

GPU和深度学习

使用更多的处理器,以做到更快

数据分析图景:GPU加速了这些大数据应用

机器学习大爆炸:DNN+大数据+GPU

深度学习发展圈

三种类型的网络:DNN(全部联系的层),CNN(一些卷积层),RNN(递归神经网络,LSTM)

DNN:M x V的浓度是关键

DNN:训练批处理,受延迟影响大

CNN:要求卷积和M x V

一个DNN中,有许多可用的平行层

TESLA M40:世界上最快的深度学习训练加速器

CPU和GPU的比较:服务器类

JETSON TX1:嵌入式深度学习

一个架构——端对端的人工智能

Tesla P100 加速器

英伟达DGX-1 :世界上首个深度学习超级计算机

实践中的深度学习

现代AI 的引擎

深度学习发展中的CUDA

英伟达深度学习SDK

cuDNN

CUDA 为基础的深度学习

cuDNN5 有什么新东西? Pascal GPU, RNNs,性能升级

英伟达DIGITS:交互式深度学习GPU训练系统。

英伟达DIGITS:提升深度学习训练的生产力、

展望DIGITS的未来:自动化和国防中的物体识别,目标是自动驾驶汽车和远程感知。

获得DIGITS的方法

英伟达 DIGITS

练手实验室

快速训练和改进DNN

建立一个数据库

找到一个标准的网络,开始训练。比如对图片进行分类

调整网络

增加或移除参数

处理增多的数据

英伟达 DIGITS

练手实验室

  1. 在nvlabs.qwiklab.com上注册账户
  2. 去往深度学习课程基础
  3. 选择“DIGITS 深度学习训练系统介绍”
  4. 点击“开始实验”

无人驾驶汽车中的端对端学习,参见论文http://arxiv.org/abs/1604.07316。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-08-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档