开发|英伟达DGX-1国内落地应用案例实访

2016年4月,NVIDIA 在硅谷发布了深度学习超级计算机DGX-1。这台超级计算机在86cm x 44cm x 13cm的空间内装入了8块Tesla P100 GPU,其性能相当于250台传统服务器。同时DGX-1的售价也高达12.9万美金。

从4月发布到9月开始交付,根据NVIDIA 公布的数据,到2016年秋季DGX-1一共收到了接近100家公司的订单。在美国,第一批的DGX-1被交付给包括OpenAI、斯坦福AI实验室、伯克利AI研究室等一批顶级研究机构。而在国内,第一批超级计算机也已于去年10月开始交付。

3个月后,AI科技评论采访了负责网易在人工智能等前沿领域研究的网易感知与智能中心总经理李晓燕。据说在过去3个月里,这里也是国内最快开展DGX-1应用的机构。李晓燕告诉我们,这台DGX-1在2016年10月中下旬交货,只用半天时间就部署完毕了。在之后的时间里,这台机器主要被用在深度学习的模型训练,在业务上则是支持网易的图像识别、语音识别、机器翻译等应用。

同在感知与智能中心的技术专家刘东则告诉AI科技评论,中心大量使用GPU来进行深度学习训练,DGX-1带来主要的好处是加速模型训练,此前在单节点上进行中等规模的数据集训练可能需要1个月时间,现在使用DGX-1大约7 - 10天就会有结果,也就是说能试验更多的算法,产品更新也会更快。

网易的人工智能部门是什么样子?

2011年,当时刚研完博士后的李晓燕在网易成立了网易多媒体技术组,这个部门后来发展成了今天覆盖算法、开发和业务孵化的感知与智能中心。一直为网易的各个业务提供人工智能相关的技术支撑,并且在逐步对外开放技术。

李晓燕说,网易的人工智能开发更多的是从业务出发,为网易业务提供“特别算法”,优化体验 。该中心自主研发的人脸分析、图像处理、音乐识别、语音识别、智能问答、机器翻译、机器视觉、计算机图形学、增强现实引擎等AI相关技术,在邮箱、游戏、云音乐、网易云、电商、有道、新闻等网易集团全产品线中都得到了应用和推广,实现了网易全产业链AI落地。

今天网易的感知与智能中心,拥有自建分布式深度学习平台,包括底层深度学习GPU集群、深度学习模型、开放能力接口,以及深度学习、语音音频、计算机视觉、模式识别、人机交互、异构计算等技术,在业务上支撑网易的邮箱、游戏、云音乐、网易云、电商、有道等等,也为企业客户和消费者提供AR、BOT、AI开放平台等产品和服务,目前已经与很多行业龙头企业展开了合作。

深度学习的硬件发展

刘东回忆,在应用深度学习进行开发的早期,他们很快发现用CPU做模型训练效率很低。2012年他们就把大部分模型训练和推理迁移到了GPU上。

而与深度学习的其他硬件加速方案相比,GPU有明显的开发效率上的优势。刘东告诉我们,在深度模型推理部分,如果利用FPGA做加速,完成编码、仿真、调试验证等整个流程一般需要数周甚至数月时间。相比之下,基于GPU方案可能一周就能完成。这显然更符合互联网产品更新的节奏。

而从NVIDIA 几代GPU,从K系列 - M系列 - P系列的使用来看,每一代在性能上都有很显著的提升,并且在软件服务端更新地很快。比如NVIDIA 在去年专门推出了针对LSTM网络计算加速的SDK升级,这在机器翻译等自然语言处理项目中被广泛使用到。

NVIDIA 内部跟深度学习圈子有大量的互动,包括与DGX-1的客户也保持着密切的沟通,在深入了解企业使用情况与行业需求的基础上,进一步提升相关技术和用户体验。同时,NVIDIA本身也是DGX-1的深度用户,通过在众多领域应用DGX-1向工程团队提出反馈和建议。

一名NVIDIA 的工作人员告诉AI科技评论,在GTC前夕,NVIDIA 通常会举办一个小型的深度学习峰会,一般会邀请深度学习领域的大牛以及创业公司,一起探讨下一代硬件和软件如何更好地支持各种研究和应用。黄仁勋在内部对此相当重视。此外,今年即将于5月在硅谷举办的GTC,也将会有涉及DGX-1用户、医疗、公共服务等的专场论坛来做相关探讨。

前Orbeus首席科学家Wei Xia在知乎上的回答也印证了这个说法:“我还记得我们当时提了关于训练的时候如何visualize的问题,并给他们展示了我们当时自己开发的简陋版monitoring system,过了几个月他们在发布Digit-Box的时候就有一个还不错的visualization system了。”

从NVIDIA 的角度看,过去一年它在深度学习的软硬件提供上继续完善,DGX-1补充了强劲的训练平台,而Tesla P40、P4则是强调能效的推理产品线。

NVIDIA 方面告诉我们,目前在国内,除了网易,海康威视等多家机构都在部署DGX-1。眼下在12.9万美金的高价之下,大公司和资金充裕的研究机构会是DGX-1的第一批尝鲜者。但在1 - 2个季度之后,这一情况也有可能会发生变化。一个原因是与NVIDIA 合作的OEM厂商们将会推出各自品牌、不同规格的深度学习超级计算机。

更重要的一方面在于中小型机构的应用。NVIDIA 在医疗领域的合作伙伴承蓝科技CEO姜意告诉AI科技评论,DGX-1的推出可能会帮助科研院校还有医院一类机构对深度学习进行快速部署,对于IT能力较弱的机构来说,接近“即插即用”的深度学习超级计算机是具有诱惑力的,尤其当这些应用本身有很高附加值的时候。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏DT数据侠

当机器都会“学习”了,你还想不学习么? | 数据科学50人· 谢梁

如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟...

570
来自专栏AI科技评论

业界 | 英特尔中国研究院院长宋继强:融合 AI 与 SI 推进智能机器人产业

AI科技评论按:本文作者宋继强,英特尔中国研究院院长。 ? 宋继强 今天,我们正在拥抱一个万物智能互联的新世界。越来越多的物和设备通过网络实现互联互通,让数据呈...

3094
来自专栏AI科技评论

专访小 i 机器人CEO朱频频:聊天机器人进入深耕应用场景的时候,什么才是真正的杀手锏?

AI科技评论按:今年的墨尔本IJCAI 2017上, 一众中国公司参会并出现在其白金赞助商名单上,其中的小i机器人是8家赞助商名单中比较特别的一家,或许它的AI...

3094
来自专栏腾讯研究院的专栏

算法决策兴起:人工智能时代的若干伦理问题及策略|AI观察

本文系根据腾讯研究院研究员曹建峰在“全球人工智能技术大会·2017”的分论坛“AI变革时代的智能系统测评分论坛”上的演讲整理而来。 ? 大家好!很荣幸今天有...

22910
来自专栏人工智能快报

美计算机社区联盟发布人工智能白皮书

美国计算机社区联盟(CCC)发布《人工智能的进步需要所有计算机科学的共同进步》白皮书,指出人工智能与更广泛的计算机科学之间相互影响的六大潜力领域的研发机遇,以支...

3225
来自专栏CDA数据分析师

果断收藏!机器学习人才发展全面指导手册(含学习路径和职业规划)

机器学习的学习路径 一、为什么是列出一堆可以探索的书,而不是要去寻找一条路 机器学习的研究和应用已经有很长的时间了。随着人类的发展,数据和计算能力都在不断的增加...

1836
来自专栏大数据挖掘DT机器学习

研究生:数据分析/挖掘工作的疑惑?

数据分析/挖掘工作的疑惑 本人在读硕士一名,研二,理工科,所作工作于这两方面无关。但是,最近对这个方向特别感兴趣,真的很想从事这方面的工作。目前,正在自学中,以...

3385
来自专栏罗超频道

如何让搜索引擎拥有“生命”?

在许多人看来搜索引擎只是一个检索工具,就像其他冷冰冰的科技产品一样。实际上,搜索引擎正在成为人人依赖的智能助手。它在拥有感知环境和自我学习的能力后,随着岁月流逝...

3705
来自专栏CDA数据分析师

吴恩达 | AI是新的电力 | 演讲稿全文整理(附视频中字)

在上周O’reilly举办的AI Conference上,吴恩达进行了主题为“AI是新的电力”长达25分钟的演讲,演讲中吴恩达亲自板书,内容也是干货满满了。 在...

2125
来自专栏华章科技

算法和模型怎么高效挣钱?看美国商学院终身教授怎么说

熊辉是计算机系出身的博士,却在商学院任教。自他开始,引领了一股计算机科学解决实际商业问题的潮流。他的研究围绕商业需求,擅长挖掘问题的本质。在推荐系统、地理数据挖...

523

扫描关注云+社区