HPC技术趋势:HPDA、深度学习、软件定义和机柜即HPC

百度首席科学家吴恩达(Andrew Ng)曾经说,深度学习的前沿正转移到高性能计算(HPC),NVIDIA、AMD及Google、阿里巴巴等公司也确实都在为深度学习研发HPC的新能力。那么,深度学习任务为HPC注入了哪些新的东西?除了深度学习,HPC还有哪些值得关注的技术趋势?在9月24日的2015高性能计算用户大会(HPCUF2015)上,北京航空航天大学教授、国家863计划“高性能计算机及其核心软件”重大专项总体组组长钱德沛,浪潮集团高性能计算总经理刘军,以及IDC 副总裁、IDC HPC User Forum执行总监Earl C. Joseph II接受了CSDN记者的采访,对云计算大数据时代的HPC技术趋势进行了深入的解读。

在整个访谈过程中,三位专家立足应用展开回答。钱德沛表示,Top500套数的动态排名中,中国的起伏并不足虑,应当关心的是HPC的整体发展水平,更进一步地说,是要关注到底哪些领域进了Top500榜单和实际发挥的作用。他认为,HPC应该避免把自己限制到很窄的范围,要有一定的量才能促进应用的发展。

Earl C. Joseph II认为,大数据时代的到来,让HPDA(基于HPC的大数据分析)应用成为HPC的下一个爆点,目前67%的HPC资源用于HPDA,而机器学习/深度学习的需求是其中较为典型的应用,一个解决思路是众核扩展。此外他还谈到了云计算的趋势,认为云端HPC不宜使用虚拟化。这些都需要应用设计考虑。

作为HPC硬件支持平台提供方,浪潮更能切身感受到云、大数据、深度学习、IoT对HPC带来的冲击,也更加需要未雨绸缪,刘军表示,复杂的应用环境下,需要统一的计算架构能够应对多样性的计算、混合计算的场景,这就要做到基础架构的融合,进而实现软件定义HPC。硬件融合的一个典型,就是机柜即HPC。

HPDA

传统的计算形态,包括追求存储容量和追求性能两种方式。前者是传统的互联网用户所关注的,研究怎么在更低功耗情况下给出更多的存储量的计算,比如Hadoop;后者追求在最短的时间跑出更准确的结果,即传统HPC,对计算、内存、网络、I/O要求很高。但大数据打破了二者的界限,推动了HPC的演进。

Earl C. Joseph II表示,大数据与HPC的结合正在衍生很多新的方案,也就是HPDA技术,比如图分析、语义分析和知识发现等。这让更多的用户加入到了HPC。IDC预测,全球HPDA服务器2015年营收可达11亿美元。

Earl C. Joseph II列举了HPDA的几个典型案例:

  • 基于超算的分析开始改变医疗行业
  • 美国邮政管理局(USPS)为HPDA转向HPC
  • Paypal声称更多的财富2000强公司能够从HPDA获益

USPS的Total Revenue Protection Program(TRP计划),使用近实时分析指导动态路由和通过Sunday delivery和same-day delivery创造新的营收机会。该计划采用了MCDB(memory-centric database),在6小时之内处理40亿事务。

对于Paypal本身,根据IDC的估算,基于HPDA的欺诈检测已经为Paypal省下了7亿美元。Paypal未来希望通过HPC做整个IT基础架构的管理,以及用于市场营销的Beacon计划。(链接:年交易额1800亿美元,揭秘PayPal成功背后的三大热门技术)

Paypal目前的规模如下:

  • 每天1000万+登录
  • 每天1300万+交易
  • 每天约40亿inserts
  • 每天约80亿selects

IDC认为,存储是HPDA市场增速最快的部分,与此伴随的是HPC互联技术也在变革,数据迁移/管理则是一个主要痛点。

云的架构是数据存储、数据共享的一个流行方案,在大数据时代,也确实有不少的HPC在云端(IDC最新调查结果显示25%的HPC在云上),但在Earl C. Joseph II看来,HPDA要能够搞定各类数据,并行算法以,数据科学家开发的算法,并且对性能非常敏感,基于虚拟化的公有云,在HPDA方面还有所欠缺。

刘军则认为,云计算、大数据与HPC之间的影响是相互的:HPC需要云解决更多的资源共享和服务、计算便利性问题,大数据需要HPC解决性能问题,同时大数据技术也为解决传统HPC不好处理的问题带来灵感。这是一个交互的作用,最后出来的形态,浪潮叫做Big Computing(大计算),他不再是传统的HPC,传统的大数据和云,而是二者的融合,是一种新的大的形态。

钱德沛也谈到,不能划分容量型应用和性能型应用的资源边界。他表示,传统超级计算主要是强调能力型应用,但在中国的国情下,超级计算机安装在通用的超算中心,能力型应用和容量型应用共存并分享系统的资源,不可能排斥容量型应用。大数据应用大多数是容量型的,包括互联网应用、数据分析、数据挖掘,但是也有一些是能力型的应用,而且越来越多的能力型应用需要超过单独服务器通过以太网互联起来的资源的能力。这一类应用可能随着互联网应用发展越来越多,并且和老百姓的生活相关,比如大量的数据挖掘、金融计算和数字媒体的渲染。

从整个HPC应用的发展来看,Earl C. Joseph II谈到了如下趋势:

1. 基于众核的扩展性。应用需要设计成为更有扩展性的,不仅仅在一个核或者几个核上,而是在众核上的扩展性。

2. 云、大数据和HPC。云一般是基于虚拟化的,但虚拟化会让HPC性能变慢,在未来HPC的应用需要结合云的应用和HPC的特点。

3. 云端可靠性。HPC的应用,特别是在云端,其设计的理念是:云端硬件故障的情况下还能继续运转,保持工作稳定性。

4. 应用的发展趋势基于应用的寿命。目前有些应用只存活几个月,而未来HPC应用应该是有五六年的寿命,五六年中硬件会有一个飞速的增长,所以应用的设计考虑到这方面的需求。

5. 工业应用定制化。在CFD工业设计领域,比如汽车设计,应用一旦跑起来,工程师就能看到设计出的车的特点,以后的趋势是会有不同的应用用于汽车设计,因为汽车应用的特点非常鲜明。

深度学习

依赖于数据量和计算力的深度学习,是HPDA的典型应用。根据浪潮过去这一年HPC业务接近100%的成长经验,快速成长的推动力就来自于深度学习和工业应用。刘军介绍了这两种需求:

  • 工业应用:眼下从中国制造到中国创造的转型期,工业、企业自主创新的能力越强,就越需要像HPC这样的技术来帮助提高产品设计的质量。因为要创造、要设计、分析,很多复杂的需求将需要HPC来帮助实现,比如电器、汽车、飞机的设计。
  • 深度学习:在商业上需要利用大数据做顾客信息的分析,还包括深度学习在互联网的应用,比如哪些广告搜索排名靠前,这些都是HPC在商业化的应用。

但是否应当那么单独强调深度学习呢?钱德沛认为,百度成功的经验之一是用HPC的能力进行深度学习,深度学习是HPC应该考虑的应用之一,当然深度学习不是全部。

他表示,HPC没有固定的模式,现在要避免把自己限制到很窄的范围,因为很多应用是有发展的,可能开始的时候可能是容量型应用,到了一定的水平就变成了能力型应用。所以,应用的多样性、系统支持和适应应用是很重要的,不能把HPC做的像阳春白雪一样,要有一定的量才能促进应用的发展。

深度学习的特殊性,在于新鲜而实用,同时对计算力上限需求非常高,只要神经网络模型和数据量允许,软件上还要实现数据并行和/或模型并行来加速。另一方面,深度学习的用户主要是互联网公司,往往采用分布式的架构做大数据,用单机做学习,同时对HPC的解决方案流程不一定很熟悉。所以,浪潮也选择深度学习作为Big Computing的一个突破点,提供一些面向深度学习的一体化HPC方案。

钱德沛认为,做机器的难处就在这里,它要适应不同类型的应用需求,同时要考虑能够使用的技术、实现的手段,要在技术条件下和应用需求下选择最优,做工程上的折中、权衡。换句话说,不管是流计算,还是未来的神经网络芯片,只要顺应应用,也是HPC可以考虑的体系结构。

软件定义HPC

对于钱德沛提到的难点,其实刘军在大会的主会演讲上也做了分析,他提出的Big Computing,就是要做到基础架构的融合,进而实现软件定义HPC,灵活地应对不同工作负载的需求。

钱德沛表示,软件定义的思想很老,但对于解决当前HPC用标准化的硬件适应应用多样性的问题,技术上、商业上都具有可行性。

刘军介绍了浪潮在软件定义HPC方面的进展:

在产品技术上已经做这样的布局和应对,现在这个工作没有完全完成。有的已经具备产品的基础,在计算环境已经完成准备好了,有的还在路上,比如64路、支持48TB大内存的主机,在明年才能发布。第二层的融合基础架构,思路上和浪潮在互联网领域走的比较早的SmartRack是一脉相承的。 浪潮即将推出“机柜即HPC”的产品,实现计算存储的融合,以及初步的软件定义网络。在软件设施层次,浪潮已经分别实现了软件设施数据、服务网络服务和资源服务三个层面,现在要进一步整合,相互之间打通,形成真正核心的软件定义HPC。

附:中外HPC的差别

谈到中外HPC的差别,Earl C. Joseph II认为,主要在于主要中国HPC的应用刚刚发展,所用的芯片和硬件都比较标准。而美日欧的HPC已经有35年的历史,很多HPC应用是35年前写的,这些应用的发展,一开始就在一种或几种处理器上,现在也只能在一些已经淘汰的处理器上跑。中国HPC起步比较晚,但是可以根据现在最新的技术编写应用,这些应用也都是比较标准化、商业化的。

此外,Earl C. Joseph II对浪潮、曙光、华为、联想等中国公司在HPC市场的表现评价颇高。他表示:

这四个厂商都表现不错,有不同的战略。浪潮是在全球有个布局,联想买了IBM的X86的业务也表现不错。IDC拿到的数据显示,浪潮、惠普和Cray在HPC领域有很好的增长,而IBM、Hitachi和戴尔有所下降,IBM把X86业务卖了以后有5%的下降。

对于这些中国公司的全球化策略,他还给出了如下三个建议:

  1. 首先定位好公开市场。欧洲是一个非常好的公开市场,比如德国、英国、意大利等国家每年有很多的需求。
  2. 美国的一些市场,美国政府是非常的支持,所以可以定位在美国的工业界和美国的大学。
  3. 比较有效地找到当地的合作伙伴和渠道,这样能够解决一些当地的法律、规则的问题。

原文发布于微信公众号 - CSDN技术头条(CSDN_Tech)

原文发表时间:2015-09-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏罗超频道

吴刚和吴京谁更红?今日头条用大数据找到了答案

年底各个平台都在做盛典,不过,能吸引众多主流一线明星集体前往的盛典不多,说白了,不是每个平台都有这样的影响力和号召力。12月17日,今日头条今年举办“我是头条·...

45812
来自专栏云计算D1net

借OpenStack建Helion云计算生态系统

在世人眼中,IBM、微软、亚马逊(Amazon)、谷歌(Google)、甲骨文等是当之无愧的云计算领先公司,尤其是在国内,前三者都已宣布了在国内相应的合作伙伴,...

3495
来自专栏AI科技大本营的专栏

专访 | 商汤HPC负责人刘文志(风辰):未来战略的两大方向及招人的4个标准

记者 | 鸽子 前不久,商汤刚刚完成了4.1亿美金的B轮融资,创下了人工智能领域最大融资金额的记录。 据业界人士透露,之所以能完成这次巨大数额融资,一方面是因为...

4895
来自专栏VRPinea

不想孩子输在起跑线上?那就试试VR教育吧!

3719
来自专栏镁客网

在商业化道路上,小冰还要再多走几步

1553
来自专栏量子位

李飞飞新动向:创建斯坦福“以人为本AI研究院”,担任共同院长

近日,李飞飞宣布斯坦福大学成立“以人为本AI研究院”(HAI),将和斯坦福大学前教务长John Etchemendy共同担任院长,推动AI研究、教育、政策和实践...

1102
来自专栏镁客网

与亚马逊合作智能音箱,英特尔的眼中却只有“芯片”

1595
来自专栏企鹅号快讯

今日头条遭最严整顿 智能算法显瓶颈

猎云注:近日,今日头条遭遇“最严整改”,在被网信办约谈、暂停更新部分频道内容后,它宣布关闭社会频道,新时代频道同时被设置为默认频道,并于12月31号集中清理了1...

2006
来自专栏罗超频道

看完陆奇训话百度工程师的“五大信条”,无人车创业者头疼了?

最近陆奇在百度内部Engineering Leadership Talk上的内部讲话被曝光,这是百度技术线员工的培训分享活动,陆奇给百度工程师提出了五条关于工作...

3486
来自专栏大数据和云计算技术

政务大数据系列9:政务大数据的价值链

政务是个大市场,阿里、腾讯、电信、华为都在赔本赚吆喝。本文作者宇同学是资深从业人士,研发总监,他会写一系列文章来阐述政务云全景。 前面八篇...

9495

扫码关注云+社区

领取腾讯云代金券