DeepRack深度学习一体机要逆天了?

深度学习(Deep Learning)在这两年风靡全球,大数据和高性能计算平台的推动作用功不可没,绝对算得上是深度学习的“燃料”和“引擎”,而GPU(图形处理器)则是引擎中的引擎,基本所有的深度学习计算平台都采用GPU加速,其出色的浮点计算性能特别提高了深度学习两大关键活动:分类和卷积的性能,同时又达到了所需的精准度。

采用GPU加速与只采用CPU训练CNN(卷积神经网络)的性能比较

  以ImageNet竞赛为例,基于GPU加速的深度学习算法,百度、微软和Google的计算机视觉系统在ImageNet图像分类和识别测试中分别达到了5.98%(2015年1月数据)、4.94%(2015年2月数据)、4.8%(2015年2月数据)的错误率,接近或超过了人类识别水平。

  深度学习为什么会选中GPU呢?与CPU擅长逻辑控制和通用类型数据运算不同,GPU采用了数量众多的计算单元和超长的流水线,但只有非常简单的控制逻辑并省去了Cache,面对的是类型高度统一、相互无依赖的大规模数据和不需要被打断的纯净的计算环境,擅长大规模并发计算。相比之下,CPU的计算能力只是GPU很小的一部分。

CPU与GPU的结构对比图

  因此,与单纯使用 CPU 的做法相比,GPU 具有数以千计的计算核心、可实现 10-100 倍应用吞吐量,在同样的深度学习程序中,应用单个GPU的执行速度比单纯使用 CPU快上10倍。按照这样的比率,云创大数据刚发布的DeepRack深度学习一体机,在4个节点满配时,相当于160台选用英特尔E5-2600系列至强处理器的服务器,可提供最大每秒128万亿次的单精度计算能力,计算性能完全逆天。

DeepRack深度学习一体机全景图

  具体而言,DeepRack深度学习一体机可配置4个4U高性能节点,每个计算节点可插入4块英伟达GPU卡,在 CPU为Dual E5-2620 V3、GPU为Titan X的硬件配置之下,单个GPU执行速度比单纯使用 CPU快上10倍,那么每个节点的执行速度就是单纯使用 CPU的 40倍,整个机柜包括4个这样的计算节点,也就是160倍,满配时的DeepRack深度学习一体机相当于160台单纯使用 CPU的服务器。

DeepRack深度学习一体机计算节点内部图

  除了强悍的硬件支撑,DeepRack深度学习一体机同时预装CentOS操作系统,集成了两套世界一流的开源工具软件——Google的TensorFlow以及加州大学伯克利分校的Caffe,可以帮助学习诸如图像识别、语音识别和语言翻译等任务。与此同时,DeepRack还提供MNIST、CIFAR-10、ImageNet等图像数据集以及一百万张车牌的图片数据,可满足实验与模型塑造过程中的训练数据需求。

  对于深度学习开发者而言,还需要面对软件系统的部署和调试、复杂的算法、频繁的参数调节等多重难题。对此,在DeepRack深度学习一体机之外,云创大数据将提供免费周到的培训,使用户根据操作手册即可快速搭建属于自己的深度学习应用,享受从部署到使用提供完整的服务体系,帮助用户带出一个能够切实应用深度学习的团队。

  对于门槛高、部署难的深度学习而言,DeepRack深度学习一体机完全是深度学习利器。经过选配组合,用户可选择极简型、经济型、标准型以及增强型等四种规格。其中,极简型作为单机,拥有单一节点,其他三种规格则是包括4个节点的独立机柜。

硬件配置参数

来源:中国大数据

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2016-10-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI传送门

股票预测,自动翻译,你想要的它都能做——RNN算法探索之旅(3)

1823
来自专栏机器之心

业界 | 在个人电脑上快速训练Atari深度学习模型:Uber开源「深度神经进化」加速版

选自Uber AI 作者:Felipe Petroski Such、Kenneth O. Stanley、Jeff Clune 机器之心编译 参与:路、李泽南 ...

2988
来自专栏FreeBuf

基于标记数据学习降低误报率的算法优化

无论是基于规则匹配的策略,还是基于复杂的安全分析模型,安全设备产生的告警都存在大量误报,这是一个相当普遍的问题。其中一个重要的原因是每个客户的应用场景和数据都多...

2948
来自专栏TensorFlow从0到N

TensorFlow从0到1 - 19 - 回顾

see you soon 《TensorFlow从0到1》就要结束了。 3条主线 这个部分共包含18篇文章,4万余字(简书的严格统计不到4万)。总的来说,它无外...

3744
来自专栏用户画像

浅析UGC视频去重算法

在以UGC(User Generated Content 用户原创内容)业务为主的视频网站中,每天都有大量的视频被上传。用户上传的视频有数量大、重复视频多的特点...

3004
来自专栏吉浦迅科技

AMD MLP:基于OpenCL的深度学习工具

AMD-MLP 深度学习技术 AMD-MLP是AMD中国异构计算部门开发的私有软件,其开发人员都是GPU计算和应用方面的专家,在使用异构计算技术提高软件性能方...

5405
来自专栏目标检测和深度学习

厉害了,我用“深度学习”写了个老板探测器(附源码)

如果上班的时候想放松一下,或者直说想偷偷懒,看点和工作无关的网页,这时候万一老板突然出现在背后,会不会感到很难堪呢? 有的浏览器设置了boss按键,手快的人还可...

3567
来自专栏ATYUN订阅号

深度学习框架入门选择,Keras还是PyTorch?

你是否希望能够学习深度学习?你是想将其应用于商业,以此为基础建立你的下一个项目,还是仅仅是增加自己的职场价值?无论如何,选择合适的深度学习框架进行学习都是关键的...

1305
来自专栏Pulsar-V

SLAM初探(三)

PCL(Point cloud library) Ubuntu Linux 16 系统之所以会用Linux,很大的原因是应为SLAM在嵌入式平台上面...

3585
来自专栏CDA数据分析师

带你十分钟看懂机器学习与 TensorFlow(GDD 2017)(附视频中字)

TensorFlow是世界上最流行的开源机器学习框架。在2017年谷歌开发者大会欧洲站中,Andrew Gasparovic介绍了TensorFlow以及发展的...

4678

扫码关注云+社区

领取腾讯云代金券