【新智元导读】英伟达2016年Q2财报大好,股价创历史新高,从CEO黄仁勋投资人会议发言可以看出,英伟达接下来有向数据中心和自动驾驶发力的迹象,这两者核心还是深度学习。日前英特尔宣布收购初创公司Nervana,CPU巨头终于在深度学习芯片市场与英伟达短兵相交。本文后附华盛顿大学英伟达技术产品报告,用数据告诉你GPU巨头如何深耕深度学习。
上周四,英伟达2016年Q2财报公布,表现超出预期,英伟达股价随后也创下历史新高,不仅如此,市场对英伟达Q3的预期也比原来增加了2亿美元。
英伟达Q2销售额共计14.3亿美元(同比增长24%),每股收入0.4美元(同比增长700%)。其中,GPU销售额比去年同期增长25%,达到12亿美元。
游戏依然是英伟达立足市场的主力,占据总销售额的55%,但相比去年仅实现18%的增长;而数据中心(增长110%)、自动驾驶(增长68%)和专业图像处理(增长22%)这些新业务,增长率明显升高。
全副身家押注深度学习
英伟达在图像处理技术方面一直处于市场领先地位,最近这家公司开拓新领域的决心也得到了华尔街的回应。
CEO黄仁勋在投资人会议上强调,深度学习是英伟达十分重要的增长动力,也是公司一直持续大力投资的领域,“过去5年来,我们一直默默投资深度学习,因为我们相信深度学习未来对整个软件产业、整个计算机产业都有着深远的影响,我们把一切都赌在了深度学习上”。
黄仁勋还指出,英伟达数据中心业务(销售额约1.5亿美元)中,大约有一半都是深度学习系统,这也是得益于公司在深度学习芯片方面的大力投入。
然而,相比英特尔2016年Q2在数据中心40亿美元的盈利,英伟达在数据中心的业务就显得沧海一粟。不过,英特尔数据中心Q2的增长率仅为5%。
黄仁勋罕见地在投资人会议上对英特尔的处理给出了极高的赞誉,称英特尔制造的CPU是数据中心最好的CPU,英特尔Xeon系列处理器对大多数数据中心而言,都是不可或缺的。
英特尔上周收购了深度学习初创公司 Nervana Systems,也计划制作深度学习专用芯片。Nervana 由原高通神经网络研发负责人于 2014 年创建,拥有目前最快的深度学习框架,Nervana 预计明年初推出的深度学习专用芯片,号称速度比 GPU 快10倍。对于英伟达来说,英特尔此举显然构成了极大的威胁。
目前看,游戏平台依然是英伟达的核心业务,但这家公司正把未来堵在深度学习和自动驾驶上面,华尔街也对此表示积极观望。
此外,英伟达为自动驾驶汽车开发的芯片也引起了投资人的注意。英伟达Q2在汽车方面的销售额1.19亿美元,主要是车载信息娱乐系统。英伟达使用自己的硬件,结合DriveWorks软件,开发了所谓的限量版“汽车超级计算机”,发货给80多家厂商。英伟达方面有意出货给更多的厂商,但具体时间线还不能确定,可能很快,也可能还需要几年,黄仁勋表示“开发自动驾驶汽车是很浩大的工程”。
英伟达:利用规模优势快速迭代,制造更快的处理器
英伟达CEO黄仁勋在CES上谈论公司在深度学习以及自动驾驶方面的投资。来源:BloombergNews
在投资人会议后,黄仁勋接受了 Venture Beat 记者采访,比较详细地谈了英伟达在 VR、深度学习和自动驾驶方面的策略。
VB:你在会议上说Pascal架构发布很顺利,能具体讲一下细节吗?
黄仁勋:我们在 4 款不同的GPU生产方面大力投入,每一款都比以前更好。一个季度推出4款不同的GPU,4 种不同的16纳米FinFET 处理器,这是前所未有的。我们的GPU也使用了世界上最快的存储器:GP100的HBM2和Titan、1080的G5X。我们还使用了3D堆叠存储器。所有这些都在Pascal架构里面得到了实现。
性能也是全新的。Pacal架构是世界首个拥有多画面投影技术(multi-projection)的图像处理架构,使用了全新的深度学习架构。再考虑到所有这些事情都在一个财报季度里执行实现,我感到非常自豪。
VB:VR业务前景如何?
黄仁勋:你也知道,我们跟VR显示器的关联度是很高的。我们对VR保持密切关注。VR业务前景很好。我所见的一个比较大的意外是英伟达的 Fun House。下载量非常高,很受欢迎。表现很不错。
HTC Vive VR 游戏 Funhouse
VB:对于Pascal架构,你认为促进销售量的是游戏玩家(hardcore gamer)还是VR用户,或者说这两者是同一类人?
黄仁勋:大部分还是游戏玩家。我说过,你也知道——电子游戏产值大幅增长,正因此高端GPU装机量得到了增长。下一代主机Scorpio和Neo发布在即,我也十分期待。主要还是电子游戏产值持续增长。
VB:你以前曾经提到过,VR初创企业整体表现活跃。同样,AI和深度学习初创企业市场也十分兴旺。在你看来这两者的势头哪个更强一些?
黄仁勋:两者势头一样。数量也会持续增长。在生命科学和健康医疗领域有很多AI公司,显然交通运输也有很多。金融科技也不少,还有一些做企业软件的。AI触及的范围正在不断扩大。而VR领域,我们看见有很多触觉(haptics)相关的初创企业。触觉也将成为VR十分重要的一个分领域。
VB:英特尔收购了Nervana。你对跟英特尔在深度学习之间的竞争怎么看?
黄仁勋:我们专注于我们应该做的。我们对产业动态有很好的把握。我们知道市场上都发生了些什么。深度学习应用很广,深度学习产品将得到大规模制造。现实也正是如此。我们知道深度学习架构这种新的计算模型,在并行架构上运行起来会更好。传统的计算机架构需要针对深度学习进行改造。GPU到GPU之间的计算是实现深度学习的一种很好的方法。
我们的方法是在现有GPU架构的基础上不断演化发展,以我们所能做到的最快的速度提升深度学习。我们在规模上有优势,我们也在利用我们在规模上的优势快速迭代,建造更快的处理器。
VB:你认为自动驾驶汽车热潮会发展多快?
黄仁勋:自动驾驶在明年将会得到巨大改善。我期望见到实质性的发展。我预期全世界的公司都开始使用地图技术,在出租车服务方面也有所布局。卡车也变得自动化。接下来一两年就能看到。
英伟达产品技术报告
关注新智元,在公众号首页回复0815,可下载英伟达51页深度学习报告。
英伟达Q2已经交出了一份投资人满意的答卷。那么,面对接下来英特尔介入后的深度学习芯片市场,英伟达又将表现如何呢?
下面是今年 4 月华盛顿大学制作的一份关于英伟达加速计算的报告,从中我们可以窥见这家公司在深度学习技术和产品方面的积累。
英伟达加速计算
四大领域:游戏、PRD可视化、数据中心和自动驾驶
创新驱动:科学计算、机器学习、虚拟现实和无限制访问
英伟达 DGX-1
世界上第一个深度学习超级计算机
专为深度学习设计,为主要AI框架提速
报告目录:
什么是深度学习
GPU和深度学习
实践中的深度学习
什么是深度学习
无处不在的深度学习:
传统的深度学习:手动调节特征
图像、声音和文本
深度学习的路径:训练到部署
人工神经网络:简单的、可训练的数学单元,能集体学习复杂函数
人工神经元
深度神经元网络(DNN)
应用分析:
任务对象:人脸识别
训练数据:10-100M 图像
网络结构:-10层,1B参数
学习算法:-30 Exaflops -30 GPU 门
神经网络更容易扩展:当决策空间是非线性的,特征的数量可以非常大。
深度学习的好处:
鲁棒性:不需要提前设计特征。根据手上的任务,特征可以自动进行优化。数据中自然变量的鲁棒性可以自动学习。
可普及:相同的神经网络方法可以被用于许多不同的应用和数据类型。
可扩展:随着更多的数据和方法可以大规模地并行实施,性能得到提升。
AI竞赛正火热
自动驾驶中的深度学习
百度深度语音:中英语音识别端到端深度学习
准确率超越人类
AlphaGo,第一个在围棋上击败人类的计算机程序。
样本研究流程
GPU和深度学习
使用更多的处理器,以做到更快
数据分析图景:GPU加速了这些大数据应用
机器学习大爆炸:DNN+大数据+GPU
深度学习发展圈
三种类型的网络:DNN(全部联系的层),CNN(一些卷积层),RNN(递归神经网络,LSTM)
DNN:M x V的浓度是关键
DNN:训练批处理,受延迟影响大
CNN:要求卷积和M x V
一个DNN中,有许多可用的平行层
TESLA M40:世界上最快的深度学习训练加速器
CPU和GPU的比较:服务器类
JETSON TX1:嵌入式深度学习
一个架构——端对端的人工智能
Tesla P100 加速器
英伟达DGX-1 :世界上首个深度学习超级计算机
实践中的深度学习
现代AI 的引擎
深度学习发展中的CUDA
英伟达深度学习SDK
cuDNN
CUDA 为基础的深度学习
cuDNN5 有什么新东西? Pascal GPU, RNNs,性能升级
英伟达DIGITS:交互式深度学习GPU训练系统。
英伟达DIGITS:提升深度学习训练的生产力、
展望DIGITS的未来:自动化和国防中的物体识别,目标是自动驾驶汽车和远程感知。
获得DIGITS的方法
英伟达 DIGITS
练手实验室
快速训练和改进DNN
建立一个数据库
找到一个标准的网络,开始训练。比如对图片进行分类
调整网络
增加或移除参数
处理增多的数据
英伟达 DIGITS
练手实验室
无人驾驶汽车中的端对端学习,参见论文http://arxiv.org/abs/1604.07316。