前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【20 亿美元赌注】英伟达推出深度学习芯片,人工智能进入主流时代

【20 亿美元赌注】英伟达推出深度学习芯片,人工智能进入主流时代

作者头像
新智元
发布2018-03-22 10:43:06
6140
发布2018-03-22 10:43:06
举报
文章被收录于专栏:新智元新智元

【新智元导读】芯片是整个智能产业的发动机,也是市场成熟度的关键指标,而且计算能力飞速发展,芯片制造商必须要在几年之内获得相应的市场回报。GPU巨头企业NVIDIA昨日宣布推出一款致力于加速人工智能和深度学习的芯片Tesla P100,其研发费用超过20亿美元,同时推出的还有全球首款面向深度学习的超级计算机NVIDIA DGX-1。这意味着人工智能真正从小众走向了主流。

GPU巨头企业NVIDIA昨日宣布推出一款致力于加速人工智能和深度学习的芯片Tesla P100,同时推出的还有全球首款面向深度学习的超级计算机NVIDIA DGX-1,每台售价12.9万美元(约合84万人民币)。Facebook、微软、百度等公司人工智能部门带头人在接受其他媒体采访时都对Telsa P100表示肯定,认为其将大幅度提高他们各自在人工智能领域的工作表现。

2016年4月5日,美国加州圣荷西举行的NVIDIA GTC技术年会上,NVIDIA联合创始人兼CEO黄仁勋公布了首个致力于加速人工智能和深度学习的GPU架构——专为当下数据处理需求研发的芯片Tesla P100。Tesla P100芯片有153亿个16纳米FinFET晶体管,核心面积610m㎡(黄仁勋说它是“迄今最大的芯片”,体积约为NVIDIA以往产品的3倍),NVIDIA对其投入研发经费超过20亿美元。

NVIDIA新推出的芯片Tesla P100,有153亿个16纳米FinFET晶体管,核心面积达610平方毫米,黄仁勋说它是“迄今最大的芯片”。图片来源:devblogs.nvidia.com

硬件能力

基于GPU并行处理的优势,Tesla P100能够实现数百CPU服务器节点性能。DGX-1采用NVIDIA新Pascal架构的Tesla P100显卡系列,数据处理速度是NVIDIA 此前Maxwell架构——才刚于2014年推出 ——显卡系列的12倍。据NVIDIA官网消息,DGX-1共装入8组各内建16BG存储器的Tesla P100显卡,配置英特尔 E5-2698 v3 处理器,7 TB的SSD硬盘用作深度学习高速缓存,系统存储器部分最大可支持512GB DDR4的内存容量,半精度条件每秒浮点运算峰值性能170万亿次,运算能力相当于250台X86服务器搭建的机群。不过,这台超级计算机的功耗高达3200W,让新智元记者认为其能效比或许是个问题。

在NVIDIA官方新闻中,Facebook人工智能实验室负责人Yann LeCun在评论Pascal架构时表示:“NVIDIA GPU正在加速人工智能的发展进程。随着神经网络越变越大,我们不仅需要内存更大、速度更快的GPU,也需要大幅提升GPU间的通信速度以及能够利用降低精度进行运算的硬件。这些正是Pascal所具备的特点。”

软件优化

软件方面,DGX-1装载了一套针对深度学习进行优化的软件功能,包括用于设计深度神经网络的NVIDIA深度学习GPU训练系统(Deep Learning GPU Training System,DIGITS),以及最新发布的第5版CUDA深度神经网络库(CUDA Deep Neural Network library,cuDNN)。此外,DGX-1内提供一些优化版的广泛应用深度学习框架,如Caffe、Theano、Torch。系统还搭配一套云端存取管理工具、软件更新,以及一个容器化应用库。

测试结果

以往25个小时才能消化的运算任务现在只需要2小时。来源:cnbeta.com

官方宣称DGX-1相当于250个X86服务器搭建的机群。来源:cnbeta.com

NVIDIA 在硬件和软件领域都对深度学习进行了特别的优化。作为芯片产业的巨头,在年度最重要的GPU技术大会上,黄仁勋演讲超过一半的篇幅都和深度学习相关。本届GTC技术大会专门发布了深度学习芯片Tesla P100和超级计算机DGX-1,还推出了一系列围绕人工智能和深度学习的相关设备和GPU新品。

芯片是整个智能产业的发动机,也是市场成熟度的关键指标,而且计算能力的飞速发展,意味着芯片制造商必须要在几年之内获得相应的市场回报。NVIDIA 敢于在Tesla P100上投下这笔高达20多亿美元的赌注,可以预计深度学习和人工智能正逐步走向主流市场。

NVIDIA的野心

黄仁勋在会上表示,如今的数据科学家和AI研究者在“home-brewed”的高性能计算解决方案上耗费了大量时间,NVIDIA研发和部署DGX-1只有一个目的:解放超越人类的能力,并将其用于解决一度无法解决的问题。

近年来,随着深度学习应用大量涌现,超级计算机的架构逐渐向深度学习应用优化,从传统CPU为主GPU为辅的英特尔处理器变为GPU为主CPU为辅的结构。在这样的背景下,作为GPU的发明人和芯片领域的领头羊之一,NVIDIA实际上早在5年前便涉足人工智能和深度学习相关应用,积极拓展市场。其中,值得注意的是自动驾驶汽车领域。谷歌的自动驾驶汽车一直使用NVIDIA的Tegra处理器;2015年3月,NVIDIA推出了Drive PX 2无人驾驶平台,据称每秒能够执行24万亿次深度学习任务。不仅如此,包括宝马、福特在内的全球50多家汽车制造商和供应商都在使用或测试NVIDIA的Drive PX平台。美国汽车专业调查公司IHS Automotive称NVIDIA的产品“将成为未来汽车的大脑”。

据参会中国台湾记者余志浩在iT Home网站报道:黄仁勋在会上频频提到深度学习技术及其将给各个产业带来的颠覆性变革;黄仁勋表示,深度学习技术不止是一种算法或App,更将成为一种全新的计算模式(Computing Model),从而令深度学习成为未来所有企业乃至个人都不能忽视的大事。

黄仁勋透露,NVIDIA与加州大学、斯坦福大学、麻省理工大学等领先科研团队达成合作,将DGX-1提供给后者用于进行深度学习训练。目前P100芯片已经投入量产,预计今年就会在云计算公司启用。此外,IBM、Dell、HP等主流服务器厂商也在生产搭载Tesla P100显卡的服务器,预计2017年第一季度上市。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-04-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档