前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NVIDIA CEO黄仁勋:智能工业革命

NVIDIA CEO黄仁勋:智能工业革命

作者头像
GPUS Lady
发布2018-04-02 10:03:58
7730
发布2018-04-02 10:03:58
举报
文章被收录于专栏:GPUS开发者GPUS开发者

序言:过去六周以来,我们为NVIDIA的开发者举办了世界巡回会议。GTC技术大会(GPU Technology Conference)从2009年开始举办,目的在提倡利用GPU大量平行处理,来达到高效能运算的新方法。GTC技术大会,俨然已成为GPU深度学习的技术军火库—创新的运算模型,足以引燃现代AI人工智能的大爆炸。AI人工智能正如火如荼地进展着,GPU深度学习开发者的数量,在短短两年间跃升了25倍。大约有1,500间AI相关的新创公司窜出,如此爆炸性的成长,加速了GTC技术大会在全球召开的需求。目前,我们已经在北京、台北、阿姆斯特丹、东京、首尔与墨尔本举办GTC大会。接下来还有华盛顿DC,下个月则会在孟买持续举办。我已经为四场GTC大会作开场演讲,以下是我演讲中的精华摘要,包括我对AI的理解与未来的看法,下一波计算机运算,将如何变革每一个产业。

计算机运算的新时代

由AI人工智能计算机驱动的智能机器,可以学习、推论、并与人类互动,这将不再是科幻小说中的情节。现在,AI人工智能驱动的自驾车,可以漫游在乡间蜿蜒的小路,在夜晚里也不会迷失方向,AI驱动的机器人可以透过尝试与错误学习驾驶的技巧。这真是一个绝无仅有的时刻,依我在计算机产业30多年的经验,没有什么技术比AI更有潜力、更有趣味。AI的时代已然来临。

我们所处在的计算机产业推动大规模的工业与社会变革,随着运算方法进化,新公司形成,新的产品出现,我们的生活随之改变。回想起过去几波的运算革新,每次的革新皆以革命性的运算模型为基础,新的架构同时扩展了运算效能与应用范围。

1995年,PC互联网的时代开端,是低成本微处理器(CPU)、标准化的作业系统(Windows 95)、掌握全球信息的入口网站(Yahoo!),三者汇集而成就的辉煌。PC互联网时代为10亿的人口带来了计算机的便利,并且实现了微软(Microsoft)的愿景,真正”让每张书桌、每个家庭都有计算机”。十年之后,iPhone将”一个网络通讯”装置放入了我们的口袋。加上亚马逊(Amazon)推出的AWS云端运算服务,行动云端的时代因运而生。我们的日常生活多了各类App应用软件,30亿人口开始享受行动运算所带来的方便与自由。

今天,我们正站在下个时代的开端,AI人工智能运算的时代,正被一个全新的运算模型给点燃,那就是GPU深度学习。这个新模型,让深度神经网络接受训练学习,从海量的数据资料中辨识出规律,且被认为是”不合逻辑”地有效,足以解答最复杂难解的信息科学难题。在这个时代,软件可以自己写程序,机器可以学习。很快地,数以百亿计的设备会拥有智能,AI人工智能将颠覆各行各业。

GPU 深度学习 “大爆炸”

为什么是现在?我之前写过的一篇文章中提到(黄仁勋:透过 GPU 加快人工智能运算速度是崭新的运算模型),2012是AI的关键年。多伦多大学的Alex Krizhevsky创造了深度神经网络,可以自动学习,从1百万张范例中辨识出影像。使用两张NVIDIA GTX 580 GPU,仅仅训练了几天,他打造的”AlexNet”即赢得了当年的ImageNet竞赛,击败所有磨练了数十年的传统辨识算法。也是同一年,史丹佛大学的Andrew Ng与NVIDIA的研究单位,认为神经网络模型越大,就等于拥有更大的大脑,于是合作推出运用大规模GPU运算系统,来训练神经网络的方法。

得到的结果震惊全世界,AI的研究学者于是转向采用GPU进行深度学习。百度、Google、Facebook以及微软是第一批采用这种方式来进行影像辨识的公司。到了2015年,这些公司已经获得了”超人类”的成果,让计算机比人类更精于分辨影像。在语音辨识方面,微软的研究单位利用GPU进行深度学习,达到了历史性的里程碑,获得接近”人类水平”的对话辨识率。

在影像辨识和语音辨识领域,GPU深度学习提供了技术基础,让机器得以学习、感知、推论、并且解决问题。GPU以模拟人类的想象作为出发,幻化出计算机游戏中惊奇的虚拟世界,以及梦幻的好莱坞电影。现在,NVIDIA的GPU可以运作深度学习算法,模拟人类智能,如同计算机的大脑般,让机器人以及自驾车能够认知并理解这个世界。就像人类能够将幻想与智慧作连结,计算机绘图与人工智能在我们的架构中合而为一。就像人类有左右脑两个模式,GPU也有绘图和运算两个模式。这或许能解释为何NVIDIA的GPU会被深度学习技术广泛采用,而NVIDIA也迅速地被认为是”AI运算公司”。

端对端平台打造全新运算模型

作为一个全新的运算模型,GPU深度学习技术改写软件开发方式及运作模式。从前,软件工程师精心刻画程序,为算法编码。现在,算法自己从真实世界大量的范例中学习,让软件自行编写程序,程序就是一连串编码的指令。深度学习打造并训练神经网络,将这个网络部署在资料中心,在面对新的资料时,懂得进行推论、预测以及分类。这个网络也可以被放置在具智能的装置中,象是照相机、汽车、机器人等等,用以理解这个世界。有了新的经验,新的资料被收集之后,再度进行训练并且让这个神经网络变得更精良。成千上万的装置收集而学习得来的信息,让整个网络的所有装置都变得更聪明。神经网络获得的好处,除了GPU越来越快的处理速度,还有大型网络的整体成效—也就是说,神经网络会越来越聪明,进步的速度将比摩尔定律还要更快。

传统的运算模型是大量的”指令处理”,新的运算模型需要的是大量的”资料处理”。为了要全面推展AI,我们打造了一个端对端的AI运算平台,这个平台架构跨越了训练和推论。数以亿计的装置与设备将加入我们的行列。

先从模型训练开始说起。我们最新的Pascal GPU投注了$20亿的资金,数千名工程师超过3年的心血投入。这是第1个专为深度学习应用而优化的GPU。Alex Krizhevsky 论文中使用的是Kepler GPU, Pascal可以训练比当初规模和速度都强65倍的神经网络。1台具备8张Pascal GPU的计算机,连上NVIDIA NVLink之后,可以创造有史以来最高的互连吞吐量,训练比250台传统服务器还要快的神经网络。

很快的,每天在互联网上出现的数百亿条询问会需要AI技术,这意味着每条询问将需要数十亿的数学运算。云端服务的整体负载量必须很庞大,才能够确保实时的回覆。为了让资料中心拥有更快的推论效能,我们发布了Tesla P40及P4 GPU。P40可以加速资料中心的推论吐纳量达到40倍,P4则仅需50瓦,是设计来为1U的OCP开放运算计划(Open Compute Project)服务器进行加速,符合典型的超大规模(hyperscale)资料中心规格。软件是NVIDIA深度学习平台中很重要的一部分,为了训练模型,我们使用了CUDA以及cuDNN,我们也发布了优化的推论引擎TensorRT。TensorRT融合了单层与跨层间的运作,删减低贡献度的部分,降低精度到FP16或INT8,藉由各种技巧改善了效能,同时不会牺牲准确度。

总有一天,成千上万的智能装置将运用深度学习的优势,执行看似聪明的任务。无人机将在仓库中自动导航,找到并捡取货品。便携式的医疗装置将会运用AI人工智能,当场诊断血液样本。智能摄影机将学会只在我们介意的状况发生时,才执行预警通知。我们打造了一个高效节能的AI超级计算机—Jetson TX1,供这样的智能IoT物联网装置采用。Jetson TX1是个信用卡大小的模块,仅消耗10瓦电力,却能达到1 TFLOP浮点运算、FP16精度的效能。这个模块采用的架构与我们最强的GPU是相同的,也能运行所有相同的软件。

简而言之,我们提供了完整配套的AI运算平台—从GPU到深度学习软件及算法,从训练系统到车载AI计算机,从云端到资料中心,到PC以及机器人,NVIDIA的AI运算平台随处可见。

每个产业皆适用的AI运算

我们的端对端平台是确保每个产业都可以进入AI发展的第1阶段,NVIDIA GPU深度学习的全球生态体系已经迅速地扩大。突破性的成果,引发各界竞相采用AI进行消费者网络服务—搜寻、辨识、推荐、翻译以及其他更多应用。云端服务的供应商,如阿里巴巴、亚马逊、IBM和微软等,使NVIDIA GPU深度学习平台为大大小小的公司所用。世界上最大的企业级科技公司,皆已配置了采用NVIDIA GPU的服务器。我们很荣幸,能够在各个GTC巡回站中针对重要产业发布策略,简述如下:

AI 交通运输:交通运输是一个商机兆亿的庞大产业,AI人工智能有机会改变它。自动驾驶车辆能够减少意外发生,改善货运及客运的服务生产力,带来新的移动服务。我们也发布了消息,包括百度和TomTom都选择了NVIDIA DRIVE PX2来开发自驾车。我们将个别与两间公司建立开放式”云端到车辆(cloud-to-car)”的平台,其中包括HD高写真地图、AI算法以及AI超级计算机。

驾驶行为是我们学习而来的第二本能,但却是一个无法利用编程方式要求计算机来执行的行为。自动化驾驶需要全面化的AI人工智能—对周遭环境的认知,确认所处状况而下的推理判断,计划最佳的路线,不间断的学习,以改善对广大而复杂世界的理解。公路上的自动化巡航,自动驾驶到达目的地,完全自动化的无人驾驶接驳车等等,如此复杂的自动化驾驶,需要开放式、可以扩充的架构。

NVIDIA DRIVE PX 2 是一个可扩充的架构,性能涵括整个自动驾驶技术所需要的AI人工智能。在GTC技术大会上,我们发布了DRIVE PX 2 AutoCruise,此技术专为y高速公路自动驾驶而设计,能够持续地进行定位及制图的工作。我们也推出了DriveWorks Alpha 1,这是我们自制的OS作业系统,支援自驾车,全方位提供自动驾驶的各项功能,包括侦测、定位、规划路线及动作反应等。

NVIDIA专注于创新,在视觉处理技术,AI与高性能运算整合的的十字路口-智能化与自动化机器罕见的整合之际,我们仍坚守岗位。这是第一次,我们能够用AI算法实现自驾车与自动化机器人的想象。因为这些技术,需要实时的、符合成本的、同时有效的运算平台。

在GTC技术大会上,我们也介绍了Xavier,这是我们有史以来推出过最雄心勃勃的计算机单晶片,也是世界上首款AI超级计算机芯片。Xavier 7由70亿个晶体管所组成,比现在最先进的服务器等级CPU还要复杂。不可思议的是,Xavier拥有等同于今年稍早在CES上发布的DRIVE PX2的马力—以仅只20瓦的电力,达到每秒20万亿次的深度学习操作。

AI 企业应用:IBM看好认知运算技术2万亿的商机,推出全新POWER8搭配NVDIA Tesla P100服务器,将AI人工智能带向企业应用。在软件方面,SAP也发出声明,已经取得两台NVIDIA DGX-1超级计算机进行研发,正积极打造机器学习的企业方案,为SAP超过190个国家,约320,000家客户服务。

AI 城市应用:在2020年时,全世界大约会有10亿台监视摄影机。海康威视若无(Hikvision)是监控系统世界级的领导厂商,正在使用AI技术,试图让我们的城市更加安全。该公司采用DGX-1来训练神经网络,打造开创性的服务器,命名为”Blade”。Blade使用16张Jetson TX1处理器,但相较于同级的21颗CPU服务器系统,只需要大约1/20的空间,1/10的电力。

AI 工厂应用:全世界约有20亿台工业用机器人,而日本是机器人研发创新的重镇。GTC大会中, 我们也宣布日本的工业机器人巨头FANUC,将从头到尾采用NVIDIA AI平台,打造未来工厂。FANUC的深度神经网络将使用NVIDIA GPU来进行训练,内建GPU的FANUC Fog系统,可驱动一整群的机器人,让他们相互学习,而每台机器人也内建了GPU,可执行实时AI的指令动作。

未来行业的下一步: GPU深度学习引发了新一波的新创公司,全世界约有超过1,500间新公司窜出,专注于健康照护、金融科技、汽车行业、消费者网络应用等等领域。Drive.ai最近刚获得执照,将在美国加州的公路上测试车辆。该公司应用深度学习技术,试图解决自动驾驶所面临的各种挑战。日本的Preferred Networks,利用Chainer框架开发IoT物联网的深度学习解决方案。Benevolent.ai位于伦敦,是首波获得DGX-1进行开发的公司之一,采用深度学习技术进行药品研究,试图解决帕金森氏症、阿兹海默症以及罕见癌症等疾病。根据CB Insights调研,AI新创公司所募得的资金在今年第二季再创新高,已超过10亿美元。

新创公司的爆炸性成长,也是AI人工智能风靡各行各业的另一指标。Fortune财富杂志最近报导,认为深度学习将”转变美国公司”。

每个人都需要AI

AI可以解决几年前我们完全无法处理的难题。利用真实世界的数据资料,计算机现在可以学会辨识以往认为太复杂、太庞大或是太细腻的影像,这些资料靠过去的人工软件或肉眼也无法分析。有了GPU深度学习,计算机模型已经可以实际运用,并且能够解决世界上最庞大的产业中的各种难题。譬如,自动驾驶车辆可能会改变拥有10万亿产值的交通运输产业。健康照护产业中,医生运用AI技术,初期便侦测出疾病,甚至用来研究人类基因组,试图治疗癌症,还能够从海量的医疗数据中分析研究,提出最好的推荐疗法。AI人工智能科技,将引领第4波的工业革命。继蒸汽机、大量生产、及自动化设备之后,智能机器人将会带领新一波的生产力提升,使大量的消费客制化服务成为可能。AI科技将会影响所有人类,AI的时代已然来临。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-11-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云小微
腾讯云小微,是一套腾讯云的智能服务系统,也是一个智能服务开放平台,接入小微的硬件可以快速具备听觉和视觉感知能力,帮助智能硬件厂商实现语音人机互动和音视频服务能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档