专栏首页AI科技评论开发|英伟达DGX-1国内落地应用案例实访

开发|英伟达DGX-1国内落地应用案例实访

2016年4月,NVIDIA 在硅谷发布了深度学习超级计算机DGX-1。这台超级计算机在86cm x 44cm x 13cm的空间内装入了8块Tesla P100 GPU,其性能相当于250台传统服务器。同时DGX-1的售价也高达12.9万美金。

从4月发布到9月开始交付,根据NVIDIA 公布的数据,到2016年秋季DGX-1一共收到了接近100家公司的订单。在美国,第一批的DGX-1被交付给包括OpenAI、斯坦福AI实验室、伯克利AI研究室等一批顶级研究机构。而在国内,第一批超级计算机也已于去年10月开始交付。

3个月后,AI科技评论采访了负责网易在人工智能等前沿领域研究的网易感知与智能中心总经理李晓燕。据说在过去3个月里,这里也是国内最快开展DGX-1应用的机构。李晓燕告诉我们,这台DGX-1在2016年10月中下旬交货,只用半天时间就部署完毕了。在之后的时间里,这台机器主要被用在深度学习的模型训练,在业务上则是支持网易的图像识别、语音识别、机器翻译等应用。

同在感知与智能中心的技术专家刘东则告诉AI科技评论,中心大量使用GPU来进行深度学习训练,DGX-1带来主要的好处是加速模型训练,此前在单节点上进行中等规模的数据集训练可能需要1个月时间,现在使用DGX-1大约7 - 10天就会有结果,也就是说能试验更多的算法,产品更新也会更快。

网易的人工智能部门是什么样子?

2011年,当时刚研完博士后的李晓燕在网易成立了网易多媒体技术组,这个部门后来发展成了今天覆盖算法、开发和业务孵化的感知与智能中心。一直为网易的各个业务提供人工智能相关的技术支撑,并且在逐步对外开放技术。

李晓燕说,网易的人工智能开发更多的是从业务出发,为网易业务提供“特别算法”,优化体验 。该中心自主研发的人脸分析、图像处理、音乐识别、语音识别、智能问答、机器翻译、机器视觉、计算机图形学、增强现实引擎等AI相关技术,在邮箱、游戏、云音乐、网易云、电商、有道、新闻等网易集团全产品线中都得到了应用和推广,实现了网易全产业链AI落地。

今天网易的感知与智能中心,拥有自建分布式深度学习平台,包括底层深度学习GPU集群、深度学习模型、开放能力接口,以及深度学习、语音音频、计算机视觉、模式识别、人机交互、异构计算等技术,在业务上支撑网易的邮箱、游戏、云音乐、网易云、电商、有道等等,也为企业客户和消费者提供AR、BOT、AI开放平台等产品和服务,目前已经与很多行业龙头企业展开了合作。

深度学习的硬件发展

刘东回忆,在应用深度学习进行开发的早期,他们很快发现用CPU做模型训练效率很低。2012年他们就把大部分模型训练和推理迁移到了GPU上。

而与深度学习的其他硬件加速方案相比,GPU有明显的开发效率上的优势。刘东告诉我们,在深度模型推理部分,如果利用FPGA做加速,完成编码、仿真、调试验证等整个流程一般需要数周甚至数月时间。相比之下,基于GPU方案可能一周就能完成。这显然更符合互联网产品更新的节奏。

而从NVIDIA 几代GPU,从K系列 - M系列 - P系列的使用来看,每一代在性能上都有很显著的提升,并且在软件服务端更新地很快。比如NVIDIA 在去年专门推出了针对LSTM网络计算加速的SDK升级,这在机器翻译等自然语言处理项目中被广泛使用到。

NVIDIA 内部跟深度学习圈子有大量的互动,包括与DGX-1的客户也保持着密切的沟通,在深入了解企业使用情况与行业需求的基础上,进一步提升相关技术和用户体验。同时,NVIDIA本身也是DGX-1的深度用户,通过在众多领域应用DGX-1向工程团队提出反馈和建议。

一名NVIDIA 的工作人员告诉AI科技评论,在GTC前夕,NVIDIA 通常会举办一个小型的深度学习峰会,一般会邀请深度学习领域的大牛以及创业公司,一起探讨下一代硬件和软件如何更好地支持各种研究和应用。黄仁勋在内部对此相当重视。此外,今年即将于5月在硅谷举办的GTC,也将会有涉及DGX-1用户、医疗、公共服务等的专场论坛来做相关探讨。

前Orbeus首席科学家Wei Xia在知乎上的回答也印证了这个说法:“我还记得我们当时提了关于训练的时候如何visualize的问题,并给他们展示了我们当时自己开发的简陋版monitoring system,过了几个月他们在发布Digit-Box的时候就有一个还不错的visualization system了。”

从NVIDIA 的角度看,过去一年它在深度学习的软硬件提供上继续完善,DGX-1补充了强劲的训练平台,而Tesla P40、P4则是强调能效的推理产品线。

NVIDIA 方面告诉我们,目前在国内,除了网易,海康威视等多家机构都在部署DGX-1。眼下在12.9万美金的高价之下,大公司和资金充裕的研究机构会是DGX-1的第一批尝鲜者。但在1 - 2个季度之后,这一情况也有可能会发生变化。一个原因是与NVIDIA 合作的OEM厂商们将会推出各自品牌、不同规格的深度学习超级计算机。

更重要的一方面在于中小型机构的应用。NVIDIA 在医疗领域的合作伙伴承蓝科技CEO姜意告诉AI科技评论,DGX-1的推出可能会帮助科研院校还有医院一类机构对深度学习进行快速部署,对于IT能力较弱的机构来说,接近“即插即用”的深度学习超级计算机是具有诱惑力的,尤其当这些应用本身有很高附加值的时候。

本文分享自微信公众号 - AI科技评论(aitechtalk),作者:德新

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-03-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 雷锋网专访CSAIL主任Daniela Rus:人机关系之未来的最靠谱预测

    前言: 人工智能的支持者们和反对者们的争论可能直到强人工智能真的出现的那一天都不会停止,但大众可能并不是非常清楚机器人和AI到底发展到什么程度了,以及认真思考过...

    AI科技评论
  • 作为本土最大企业,加拿大皇家银行一年来如何构建AI研究所?

    加拿大在人工智能学术领域的积淀有目共睹。 在这片土壤上,「深度学习三巨头」与加拿大都有着千丝万缕的联系:Geoffrey Hinton 关于深度学习大部分重要理...

    AI科技评论
  • 张钹院士:AI科学突破的前夜,教授们应当看到什么?

    AI 科技评论按:12 月 27 日 AI 科技评论去清华蹭了一个研讨会,主题是「从阿尔法 Go 到通用人工智能:脑科学与人工智能」。 这是清华大学脑与智能实验...

    AI科技评论
  • 拆解特斯拉AP2.0/2.5运算单元看未来无人驾驶域控制器的设计趋势2

    结合对DriveWorks的实际应用和性能评测,Autopilot2.0这样的硬件架构,到底能完成几级的自动驾驶呢?在此,做一些分析和分解。

    用户1908973
  • UVa 10341 - Solve It【经典二分,单调性求解】

    原题: Solve the equation: p*e-x + q*sin(x) + r*cos(x) + s*tan(x) + t*x2 + u = 0 ...

    Angel_Kitty
  • Python急转弯-1-面试篇

    算法是面试中出现频次最高,也是比较烧脑的题目;但真正的大牛还是不会太在乎面试中出现的这些题目,因为在他们看来,这些已经在大脑中演算了上百次。

    小团子
  • SQL递归查询(with cte as)

      递归CTE最少包含两个查询(也被称为成员)。第一个查询为定点成员,定点成员只是一个返回有效表的查询,用于递归的基础或定位点。第二个查询被称为递归成员,使该查...

    跟着阿笨一起玩NET
  • 类加载阶段之准备阶段

    准备阶段是为类中定义的静态变量分配内存并设置初始化值的阶段,这里的初始值通常情况下指的是对应类型的零值,比如int类型的零值为0。而给静态字段赋值通常是在编译器...

    wujiuye
  • nginx配置文件nginx.conf超详细讲解

    #nginx进程,一般设置为和cpu核数一样 worker_processes 4;                         #错误日志存放目录 er...

    互联网金融打杂
  • 消息中间件--04. Kafka常用的命令

    现在我们来创建一个名字为testTopic和testTopic1 的Topic,这个topic有两个partition,并且备份因子也设置为2:

    付威

扫码关注云+社区

领取腾讯云代金券