NVIDIA CEO黄仁勋：智能工业革命

GPUS Lady

发布于 2018-04-02 10:03:58

7920

发布于 2018-04-02 10:03:58

文章被收录于专栏：GPUS开发者

序言：过去六周以来，我们为NVIDIA的开发者举办了世界巡回会议。GTC技术大会(GPU Technology Conference)从2009年开始举办，目的在提倡利用GPU大量平行处理，来达到高效能运算的新方法。GTC技术大会，俨然已成为GPU深度学习的技术军火库—创新的运算模型，足以引燃现代AI人工智能的大爆炸。AI人工智能正如火如荼地进展着，GPU深度学习开发者的数量，在短短两年间跃升了25倍。大约有1,500间AI相关的新创公司窜出，如此爆炸性的成长，加速了GTC技术大会在全球召开的需求。目前，我们已经在北京、台北、阿姆斯特丹、东京、首尔与墨尔本举办GTC大会。接下来还有华盛顿DC，下个月则会在孟买持续举办。我已经为四场GTC大会作开场演讲，以下是我演讲中的精华摘要，包括我对AI的理解与未来的看法，下一波计算机运算，将如何变革每一个产业。

计算机运算的新时代

由AI人工智能计算机驱动的智能机器，可以学习、推论、并与人类互动，这将不再是科幻小说中的情节。现在，AI人工智能驱动的自驾车，可以漫游在乡间蜿蜒的小路，在夜晚里也不会迷失方向，AI驱动的机器人可以透过尝试与错误学习驾驶的技巧。这真是一个绝无仅有的时刻，依我在计算机产业30多年的经验，没有什么技术比AI更有潜力、更有趣味。AI的时代已然来临。

我们所处在的计算机产业推动大规模的工业与社会变革，随着运算方法进化，新公司形成，新的产品出现，我们的生活随之改变。回想起过去几波的运算革新，每次的革新皆以革命性的运算模型为基础，新的架构同时扩展了运算效能与应用范围。

1995年，PC互联网的时代开端，是低成本微处理器(CPU)、标准化的作业系统(Windows 95)、掌握全球信息的入口网站(Yahoo!)，三者汇集而成就的辉煌。PC互联网时代为10亿的人口带来了计算机的便利，并且实现了微软(Microsoft)的愿景，真正”让每张书桌、每个家庭都有计算机”。十年之后，iPhone将”一个网络通讯”装置放入了我们的口袋。加上亚马逊(Amazon)推出的AWS云端运算服务，行动云端的时代因运而生。我们的日常生活多了各类App应用软件，30亿人口开始享受行动运算所带来的方便与自由。

今天，我们正站在下个时代的开端，AI人工智能运算的时代，正被一个全新的运算模型给点燃，那就是GPU深度学习。这个新模型，让深度神经网络接受训练学习，从海量的数据资料中辨识出规律，且被认为是”不合逻辑”地有效，足以解答最复杂难解的信息科学难题。在这个时代，软件可以自己写程序，机器可以学习。很快地，数以百亿计的设备会拥有智能，AI人工智能将颠覆各行各业。

GPU 深度学习 “大爆炸”

为什么是现在？我之前写过的一篇文章中提到(黄仁勋：透过 GPU 加快人工智能运算速度是崭新的运算模型)，2012是AI的关键年。多伦多大学的Alex Krizhevsky创造了深度神经网络，可以自动学习，从1百万张范例中辨识出影像。使用两张NVIDIA GTX 580 GPU，仅仅训练了几天，他打造的”AlexNet”即赢得了当年的ImageNet竞赛，击败所有磨练了数十年的传统辨识算法。也是同一年，史丹佛大学的Andrew Ng与NVIDIA的研究单位，认为神经网络模型越大，就等于拥有更大的大脑，于是合作推出运用大规模GPU运算系统，来训练神经网络的方法。

得到的结果震惊全世界，AI的研究学者于是转向采用GPU进行深度学习。百度、Google、Facebook以及微软是第一批采用这种方式来进行影像辨识的公司。到了2015年，这些公司已经获得了”超人类”的成果，让计算机比人类更精于分辨影像。在语音辨识方面，微软的研究单位利用GPU进行深度学习，达到了历史性的里程碑，获得接近”人类水平”的对话辨识率。

在影像辨识和语音辨识领域，GPU深度学习提供了技术基础，让机器得以学习、感知、推论、并且解决问题。GPU以模拟人类的想象作为出发，幻化出计算机游戏中惊奇的虚拟世界，以及梦幻的好莱坞电影。现在，NVIDIA的GPU可以运作深度学习算法，模拟人类智能，如同计算机的大脑般，让机器人以及自驾车能够认知并理解这个世界。就像人类能够将幻想与智慧作连结，计算机绘图与人工智能在我们的架构中合而为一。就像人类有左右脑两个模式，GPU也有绘图和运算两个模式。这或许能解释为何NVIDIA的GPU会被深度学习技术广泛采用，而NVIDIA也迅速地被认为是”AI运算公司”。

端对端平台打造全新运算模型

作为一个全新的运算模型，GPU深度学习技术改写软件开发方式及运作模式。从前，软件工程师精心刻画程序，为算法编码。现在，算法自己从真实世界大量的范例中学习，让软件自行编写程序，程序就是一连串编码的指令。深度学习打造并训练神经网络，将这个网络部署在资料中心，在面对新的资料时，懂得进行推论、预测以及分类。这个网络也可以被放置在具智能的装置中，象是照相机、汽车、机器人等等，用以理解这个世界。有了新的经验，新的资料被收集之后，再度进行训练并且让这个神经网络变得更精良。成千上万的装置收集而学习得来的信息，让整个网络的所有装置都变得更聪明。神经网络获得的好处，除了GPU越来越快的处理速度，还有大型网络的整体成效—也就是说，神经网络会越来越聪明，进步的速度将比摩尔定律还要更快。

传统的运算模型是大量的”指令处理”，新的运算模型需要的是大量的”资料处理”。为了要全面推展AI，我们打造了一个端对端的AI运算平台，这个平台架构跨越了训练和推论。数以亿计的装置与设备将加入我们的行列。

先从模型训练开始说起。我们最新的Pascal GPU投注了$20亿的资金，数千名工程师超过3年的心血投入。这是第1个专为深度学习应用而优化的GPU。Alex Krizhevsky 论文中使用的是Kepler GPU， Pascal可以训练比当初规模和速度都强65倍的神经网络。1台具备8张Pascal GPU的计算机，连上NVIDIA NVLink之后，可以创造有史以来最高的互连吞吐量，训练比250台传统服务器还要快的神经网络。

很快的，每天在互联网上出现的数百亿条询问会需要AI技术，这意味着每条询问将需要数十亿的数学运算。云端服务的整体负载量必须很庞大，才能够确保实时的回覆。为了让资料中心拥有更快的推论效能，我们发布了Tesla P40及P4 GPU。P40可以加速资料中心的推论吐纳量达到40倍，P4则仅需50瓦，是设计来为1U的OCP开放运算计划(Open Compute Project)服务器进行加速，符合典型的超大规模(hyperscale)资料中心规格。软件是NVIDIA深度学习平台中很重要的一部分，为了训练模型，我们使用了CUDA以及cuDNN，我们也发布了优化的推论引擎TensorRT。TensorRT融合了单层与跨层间的运作，删减低贡献度的部分，降低精度到FP16或INT8，藉由各种技巧改善了效能，同时不会牺牲准确度。

总有一天，成千上万的智能装置将运用深度学习的优势，执行看似聪明的任务。无人机将在仓库中自动导航，找到并捡取货品。便携式的医疗装置将会运用AI人工智能，当场诊断血液样本。智能摄影机将学会只在我们介意的状况发生时，才执行预警通知。我们打造了一个高效节能的AI超级计算机—Jetson TX1，供这样的智能IoT物联网装置采用。Jetson TX1是个信用卡大小的模块，仅消耗10瓦电力，却能达到1 TFLOP浮点运算、FP16精度的效能。这个模块采用的架构与我们最强的GPU是相同的，也能运行所有相同的软件。

简而言之，我们提供了完整配套的AI运算平台—从GPU到深度学习软件及算法，从训练系统到车载AI计算机，从云端到资料中心，到PC以及机器人，NVIDIA的AI运算平台随处可见。

每个产业皆适用的AI运算

我们的端对端平台是确保每个产业都可以进入AI发展的第1阶段，NVIDIA GPU深度学习的全球生态体系已经迅速地扩大。突破性的成果，引发各界竞相采用AI进行消费者网络服务—搜寻、辨识、推荐、翻译以及其他更多应用。云端服务的供应商，如阿里巴巴、亚马逊、IBM和微软等，使NVIDIA GPU深度学习平台为大大小小的公司所用。世界上最大的企业级科技公司，皆已配置了采用NVIDIA GPU的服务器。我们很荣幸，能够在各个GTC巡回站中针对重要产业发布策略，简述如下：

AI 交通运输：交通运输是一个商机兆亿的庞大产业，AI人工智能有机会改变它。自动驾驶车辆能够减少意外发生，改善货运及客运的服务生产力，带来新的移动服务。我们也发布了消息，包括百度和TomTom都选择了NVIDIA DRIVE PX2来开发自驾车。我们将个别与两间公司建立开放式”云端到车辆(cloud-to-car)”的平台，其中包括HD高写真地图、AI算法以及AI超级计算机。

驾驶行为是我们学习而来的第二本能，但却是一个无法利用编程方式要求计算机来执行的行为。自动化驾驶需要全面化的AI人工智能—对周遭环境的认知，确认所处状况而下的推理判断，计划最佳的路线，不间断的学习，以改善对广大而复杂世界的理解。公路上的自动化巡航，自动驾驶到达目的地，完全自动化的无人驾驶接驳车等等，如此复杂的自动化驾驶，需要开放式、可以扩充的架构。

NVIDIA DRIVE PX 2 是一个可扩充的架构，性能涵括整个自动驾驶技术所需要的AI人工智能。在GTC技术大会上，我们发布了DRIVE PX 2 AutoCruise，此技术专为ｙ高速公路自动驾驶而设计，能够持续地进行定位及制图的工作。我们也推出了DriveWorks Alpha 1，这是我们自制的OS作业系统，支援自驾车，全方位提供自动驾驶的各项功能，包括侦测、定位、规划路线及动作反应等。

NVIDIA专注于创新，在视觉处理技术，AI与高性能运算整合的的十字路口－智能化与自动化机器罕见的整合之际，我们仍坚守岗位。这是第一次，我们能够用AI算法实现自驾车与自动化机器人的想象。因为这些技术，需要实时的、符合成本的、同时有效的运算平台。

在GTC技术大会上，我们也介绍了Xavier，这是我们有史以来推出过最雄心勃勃的计算机单晶片，也是世界上首款AI超级计算机芯片。Xavier 7由70亿个晶体管所组成，比现在最先进的服务器等级CPU还要复杂。不可思议的是，Xavier拥有等同于今年稍早在CES上发布的DRIVE PX2的马力—以仅只20瓦的电力，达到每秒20万亿次的深度学习操作。

AI 企业应用：IBM看好认知运算技术2万亿的商机，推出全新POWER8搭配NVDIA Tesla P100服务器，将AI人工智能带向企业应用。在软件方面，SAP也发出声明，已经取得两台NVIDIA DGX-1超级计算机进行研发，正积极打造机器学习的企业方案，为SAP超过190个国家，约320,000家客户服务。

AI 城市应用：在2020年时，全世界大约会有10亿台监视摄影机。海康威视若无（Hikvision）是监控系统世界级的领导厂商，正在使用AI技术，试图让我们的城市更加安全。该公司采用DGX-1来训练神经网络，打造开创性的服务器，命名为”Blade”。Blade使用16张Jetson TX1处理器，但相较于同级的21颗CPU服务器系统，只需要大约1/20的空间，1/10的电力。

AI 工厂应用：全世界约有20亿台工业用机器人，而日本是机器人研发创新的重镇。GTC大会中, 我们也宣布日本的工业机器人巨头FANUC，将从头到尾采用NVIDIA AI平台，打造未来工厂。FANUC的深度神经网络将使用NVIDIA GPU来进行训练，内建GPU的FANUC Fog系统，可驱动一整群的机器人，让他们相互学习，而每台机器人也内建了GPU，可执行实时AI的指令动作。

未来行业的下一步： GPU深度学习引发了新一波的新创公司，全世界约有超过1,500间新公司窜出，专注于健康照护、金融科技、汽车行业、消费者网络应用等等领域。Drive.ai最近刚获得执照，将在美国加州的公路上测试车辆。该公司应用深度学习技术，试图解决自动驾驶所面临的各种挑战。日本的Preferred Networks，利用Chainer框架开发IoT物联网的深度学习解决方案。Benevolent.ai位于伦敦，是首波获得DGX-1进行开发的公司之一，采用深度学习技术进行药品研究，试图解决帕金森氏症、阿兹海默症以及罕见癌症等疾病。根据CB Insights调研，AI新创公司所募得的资金在今年第二季再创新高，已超过10亿美元。

新创公司的爆炸性成长，也是AI人工智能风靡各行各业的另一指标。Fortune财富杂志最近报导，认为深度学习将”转变美国公司”。

每个人都需要AI

AI可以解决几年前我们完全无法处理的难题。利用真实世界的数据资料，计算机现在可以学会辨识以往认为太复杂、太庞大或是太细腻的影像，这些资料靠过去的人工软件或肉眼也无法分析。有了GPU深度学习，计算机模型已经可以实际运用，并且能够解决世界上最庞大的产业中的各种难题。譬如，自动驾驶车辆可能会改变拥有10万亿产值的交通运输产业。健康照护产业中，医生运用AI技术，初期便侦测出疾病，甚至用来研究人类基因组，试图治疗癌症，还能够从海量的医疗数据中分析研究，提出最好的推荐疗法。AI人工智能科技，将引领第4波的工业革命。继蒸汽机、大量生产、及自动化设备之后，智能机器人将会带领新一波的生产力提升，使大量的消费客制化服务成为可能。AI科技将会影响所有人类，AI的时代已然来临。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2016-11-21，如有侵权请联系 cloudcommunity@tencent.com 删除

神经网络