开发|英伟达DGX-1国内落地应用案例实访

2016年4月,NVIDIA 在硅谷发布了深度学习超级计算机DGX-1。这台超级计算机在86cm x 44cm x 13cm的空间内装入了8块Tesla P100 GPU,其性能相当于250台传统服务器。同时DGX-1的售价也高达12.9万美金。

从4月发布到9月开始交付,根据NVIDIA 公布的数据,到2016年秋季DGX-1一共收到了接近100家公司的订单。在美国,第一批的DGX-1被交付给包括OpenAI、斯坦福AI实验室、伯克利AI研究室等一批顶级研究机构。而在国内,第一批超级计算机也已于去年10月开始交付。

3个月后,AI科技评论采访了负责网易在人工智能等前沿领域研究的网易感知与智能中心总经理李晓燕。据说在过去3个月里,这里也是国内最快开展DGX-1应用的机构。李晓燕告诉我们,这台DGX-1在2016年10月中下旬交货,只用半天时间就部署完毕了。在之后的时间里,这台机器主要被用在深度学习的模型训练,在业务上则是支持网易的图像识别、语音识别、机器翻译等应用。

同在感知与智能中心的技术专家刘东则告诉AI科技评论,中心大量使用GPU来进行深度学习训练,DGX-1带来主要的好处是加速模型训练,此前在单节点上进行中等规模的数据集训练可能需要1个月时间,现在使用DGX-1大约7 - 10天就会有结果,也就是说能试验更多的算法,产品更新也会更快。

网易的人工智能部门是什么样子?

2011年,当时刚研完博士后的李晓燕在网易成立了网易多媒体技术组,这个部门后来发展成了今天覆盖算法、开发和业务孵化的感知与智能中心。一直为网易的各个业务提供人工智能相关的技术支撑,并且在逐步对外开放技术。

李晓燕说,网易的人工智能开发更多的是从业务出发,为网易业务提供“特别算法”,优化体验 。该中心自主研发的人脸分析、图像处理、音乐识别、语音识别、智能问答、机器翻译、机器视觉、计算机图形学、增强现实引擎等AI相关技术,在邮箱、游戏、云音乐、网易云、电商、有道、新闻等网易集团全产品线中都得到了应用和推广,实现了网易全产业链AI落地。

今天网易的感知与智能中心,拥有自建分布式深度学习平台,包括底层深度学习GPU集群、深度学习模型、开放能力接口,以及深度学习、语音音频、计算机视觉、模式识别、人机交互、异构计算等技术,在业务上支撑网易的邮箱、游戏、云音乐、网易云、电商、有道等等,也为企业客户和消费者提供AR、BOT、AI开放平台等产品和服务,目前已经与很多行业龙头企业展开了合作。

深度学习的硬件发展

刘东回忆,在应用深度学习进行开发的早期,他们很快发现用CPU做模型训练效率很低。2012年他们就把大部分模型训练和推理迁移到了GPU上。

而与深度学习的其他硬件加速方案相比,GPU有明显的开发效率上的优势。刘东告诉我们,在深度模型推理部分,如果利用FPGA做加速,完成编码、仿真、调试验证等整个流程一般需要数周甚至数月时间。相比之下,基于GPU方案可能一周就能完成。这显然更符合互联网产品更新的节奏。

而从NVIDIA 几代GPU,从K系列 - M系列 - P系列的使用来看,每一代在性能上都有很显著的提升,并且在软件服务端更新地很快。比如NVIDIA 在去年专门推出了针对LSTM网络计算加速的SDK升级,这在机器翻译等自然语言处理项目中被广泛使用到。

NVIDIA 内部跟深度学习圈子有大量的互动,包括与DGX-1的客户也保持着密切的沟通,在深入了解企业使用情况与行业需求的基础上,进一步提升相关技术和用户体验。同时,NVIDIA本身也是DGX-1的深度用户,通过在众多领域应用DGX-1向工程团队提出反馈和建议。

一名NVIDIA 的工作人员告诉AI科技评论,在GTC前夕,NVIDIA 通常会举办一个小型的深度学习峰会,一般会邀请深度学习领域的大牛以及创业公司,一起探讨下一代硬件和软件如何更好地支持各种研究和应用。黄仁勋在内部对此相当重视。此外,今年即将于5月在硅谷举办的GTC,也将会有涉及DGX-1用户、医疗、公共服务等的专场论坛来做相关探讨。

前Orbeus首席科学家Wei Xia在知乎上的回答也印证了这个说法:“我还记得我们当时提了关于训练的时候如何visualize的问题,并给他们展示了我们当时自己开发的简陋版monitoring system,过了几个月他们在发布Digit-Box的时候就有一个还不错的visualization system了。”

从NVIDIA 的角度看,过去一年它在深度学习的软硬件提供上继续完善,DGX-1补充了强劲的训练平台,而Tesla P40、P4则是强调能效的推理产品线。

NVIDIA 方面告诉我们,目前在国内,除了网易,海康威视等多家机构都在部署DGX-1。眼下在12.9万美金的高价之下,大公司和资金充裕的研究机构会是DGX-1的第一批尝鲜者。但在1 - 2个季度之后,这一情况也有可能会发生变化。一个原因是与NVIDIA 合作的OEM厂商们将会推出各自品牌、不同规格的深度学习超级计算机。

更重要的一方面在于中小型机构的应用。NVIDIA 在医疗领域的合作伙伴承蓝科技CEO姜意告诉AI科技评论,DGX-1的推出可能会帮助科研院校还有医院一类机构对深度学习进行快速部署,对于IT能力较弱的机构来说,接近“即插即用”的深度学习超级计算机是具有诱惑力的,尤其当这些应用本身有很高附加值的时候。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

业界 | 清华大学团队与腾讯AI Lab专项合作夺冠FPS游戏AI竞赛VizDoom

该赛事研究得到了腾讯 AI Lab 犀牛鸟专项合作计划的大力支持,研究过程中与腾讯 AI Lab 的资深研究员进行了密切合作。团队负责人为清华大学 TSAIL ...

631
来自专栏量子位

Google是否投资你,得看AI支持不支持

GV,全称Google Ventures,Alphabet旗下风险投资资金,2009年正式成立,是首批聘用工程师的VC机构,原先主要为了配合Google战略协同...

1193
来自专栏SIGAI学习与实践平台

AI时代大点兵——国内外知名AI公司2018年最新盘点【完整版】

据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家。美国占据1078家居首,中国以592家企业排名第二,其后分别是英国,以色列,加拿大等国...

19310
来自专栏镁客网

人脑即将被人工智能取代?

1825
来自专栏ATYUN订阅号

使用深度学习做自动驾驶,“PlusAI”希望在未来1-3年完成全工况L4级无人驾驶

近期接触的“PlusAI”也是一家使用深度学习做自动驾驶解决方案的公司,成立于2016年,在美国硅谷、北京、西安设有研发中心。PlusAI与包括斯坦福、西安交大...

2595
来自专栏AI科技评论

对大脑的逆向工程是不是走向强AI的唯一出路?

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,谷歌,DeepMind,Uber,微软等巨头的人...

27510
来自专栏AI科技评论

动态​|Jeff Dean亲自站台背书,揭秘谷歌大脑培训生养成计划

在国内,真正能为 AI 研究人员提供系统培训的机构不多。 大家首先想到的是微软亚洲研究院。创新工场 AI 工程院的影响力相比之下差不少,但也算一个。在这之外,能...

3617
来自专栏新智元

【谷歌I/O李飞飞】计算机视觉下一个突破在“Vision + X”,我要发明AI 杀手级应用

【新智元导读】北京时间今天凌晨,谷歌的 I/O 大会第三天的论坛《人工智能和机器学习的过去、现在和未来》由谷歌云负责人 Diane Greene 做主持,嘉宾包...

2605
来自专栏新智元

AI 淘金热 | 机器学习创业机会在哪里?

机器学习淘金热正在到来!Libby Kinsey 是 Nesta 资本的投资经理,关注技术创新已经有 12 年。她根据自己的观察,总结出这波淘金热的创业机...

3586
来自专栏罗超频道

智能搜索时代:且看知识的力量

前几天,谷歌发布了一个全新的书籍搜索产品:“Talk to Books”,用户可以通过对话的方式得到一本书籍的推荐,比如输入:“What is thebest ...

1043

扫码关注云+社区