专栏首页量子位深度学习装机指南:我们为普通青年和土豪准备了两套方案

深度学习装机指南:我们为普通青年和土豪准备了两套方案

深度学习,始于装机。

王新民 友情贡献 量子位 出品 | 公众号:QbitAI

研究深度学习该买一台什么样的电脑?我的笔记本能满足需求吗?

量子位请来小伙伴,为当前的深度学习网络训练提供了两套最新的装机方案。

第一套方案是预算为8000元的深度学习标准型台式机,这款台式机能够运行市面上几乎所有的大型游戏,完美全特效不掉帧,同时还可以顺便玩一下深度学习应用,例如奇特的风格融合。这套配置可以满足目前深度学习大部分的训练需求。

第二套方案是预算为20000左右的土豪版台式机,这款台式机为工作站主板,极其稳定,能够长时间开机稳定训练。

话不多说,直接上配置。

第一套·标准型

配件名

品牌型号

数量

价格

机箱

美商海盗船 400C 中塔侧透机箱

1

749 京东

主板

华硕 Z170I PRO GAMING Mini-ITX主板

1

1299 天猫

CPU

英特尔 I7 7700K 酷睿第7代处理器

1

1799 - 2799

内存

美商海盗船 复仇者8G DDR4 2400

2

798 京东

SSD

三星850 EVO 250G M.2 固态硬盘

1

699 京东

机械硬盘

西部数据 蓝盘 2TB 64M 台式机硬盘

1

499 京东

GPU

七彩虹GTX1060 6G超频版游戏显卡

1

1799 天猫

电源

美商海盗船VS650 额定650w电源

1

399 京东

CPU风冷器

乔思伯 HP625日食红 CPU散热器

1

159 京东

显示屏

AOC I2279VW 21.5英寸显示器

1

699 天猫

总计:8200 - 9200元(不包括显示器)

第二套·土豪版

配件名

品牌型号

数量

价格

机箱

美商海盗船 600C 中塔侧透机箱

1

999 京东

主板

华硕 /Asus X99-M WS/USB 3.1主板

1

2599 天猫

CPU

英特尔 I7 6800K 酷睿第7代处理器

1

3399 天猫

内存

美商海盗船 复仇者16G DDR4 3000

2

1878 京东

SSD

三星960 EVO 500G M.2 NVMe SSD

1

1799 京东

机械硬盘

西部数据黑盘 2TB 64M台式机硬盘

1

999 京东

GPU

NVIDIA TITAN X 12G Pascal(可替1080TI)

1

9699 京东

电源

美商海盗船 额定750W金牌电源

1

969 京东

CPU散热器

美商海盗船H80i V2 CPU水冷散热器

1

759 京东

显示屏

AOC I2279VW 21.5英寸显示器

1

699 天猫

总计:23100元(不包括显示器)

下面我们对这些配件分别进行分析:

1. 机箱

机箱的选取需要考虑两个问题:

1. 主板、CPU散热器是否能够装得下;

2. 整体散热性和稳定性是否满足需求。

先说标准版配置,在进行入门研究只用一块显卡的情况下,散热不存在问题,推荐海盗船400C的中塔机箱,小巧稳定。

对于土豪版配置,由于采用了华硕的M款工作站主板,后期具有增加到两块显卡的可能性,适当地增大机箱的空间,建议选海盗船600C中塔机箱。

如果有上四路TITAN X的打算,那么需要选取散热条件更好、空间更大的机箱,可以用跟Nvidia DevBox同款的机箱,即Corsair Carbide Air 540,也可以是追风者PK515E或515ETG中塔机箱,个人觉得后者的颜值高一些,这两款都可以用来组装具有四路TITAN X的深度学习工作站。

2. 主板

主板的基本要求是稳定性足够好,具有较多的PCI-E Gen3 x16接口。

由于标准版配置只计划选用一块显卡,故选取了游戏级别的华硕 Z170I主板,该款主板只具有一个PCI-E Gen3 x16接口。

当按工作站要求来选择主板时,有两个指标:最好是X99平台和拥有较多的PCI-E Gen3 x16接口。华硕推出了两款工作站主板,分别是具有两路PCI-e 3.0 x16接口的Asus X99-M WS/USB 3.1工作站小板和具有四路PCI-e 3.0 x16接口的Asus X99-E WS/USB 3.1工作站大板。

所以,我们在第二套土豪版配置中采用了Asus X99-M WS/USB 3.1工作站小板,可以扩展到两路TITAN X或者是GTX 1080 TI。

具有四路TITAN X的Nvidia DevBox工作站用的是Asus X99-E WS主板,当有计划上四路TITAN X打算的话,主板可以选用Asus X99-E WS/USB 3.1工作站大板,避免由于后期扩展显卡但是主板存在局限性的问题。

3. CPU

选择CPU,主要是观察三个指标:主频,核心数和总线带宽。

在第一套标准配置中,由于是单机单卡,所以选择目前主频最高的I7-7700K。i7-7700k的散片价格为1799,质保一年;盒装价格为2799,质保三年。据销售称,这两者没有实质性的差异,可根据自身需求进行选择。

在单机多卡进行训练时,总线带宽是瓶颈,所以CPU的PCI-e lane越多越好,一般消费级的CPU,PCI-e总线根数是16, 28或40,最大就是40,进一步提升带宽就需要上服务器CPU或者双路至强CPU了。

有40带宽的这个条件下,有5款CPU入围,分别是:

  • i7-5930K(2014.3 3.5G 15mb 6核)
  • i7-5960X(2014.3 3.0G 20mb 8核)
  • i7-6850K(2016.2 3.6G 15mb 6核)
  • i7-6900K(2016.2 3.2G 20mb 8核)
  • i7-6950X(2016.2 3.0G 25mb10核)

还有一款为28带宽的CPU i7-6800K(2016.2 3.4G 15mb 6核)。

Nvidia官方推出的DevBox工作站所使用的CPU是i7-5930K,由于版本的更新,所以经过参数比较,第二套土豪级配置最多使用两块显卡,上手i7-6800K是比较合适的。

如果有上四块显卡的可能,建议使用上述所提到的5款总线带宽为40的CPU。

4. 内存

消费级的i7 CPU最大支持内存是128G。深度学习工作站内存选取技巧:内存大约为显存的两倍。

因此,我们在第一套标准版配置中使用了16G DDR4 3000的内存,在第二套土豪级配置中使用了32G的内存。内存的可扩展性很强,可以在使用中根据实际的占用情况来进行增减。

5. SSD

系统盘需要使用一块SSD,能够进行高速数据读取和存储。当前SATA III接口的SSD最普遍也最便宜,不过由于上述的两个主板都具有一个M.2接口,可以买一个M.2 NVMe的SSD,速度比SATA III接口也有所提升。

利用主板的这个接口,可以根据容量的需求来选择容量为256G或者是500G的SSD,例如三星960 EVO 500G M.2 NVMe SSD。

6. 机械硬盘

机械硬盘分为日常蓝盘(家用存储)、NAS红盘(网络数据存储)、企业金盘(密集读取型)、监控紫盘(存储密集型)、游戏黑盘(高端存储型)。

硬盘数据存储要求稳定,不存在数据丢失。

蓝盘为日常家用,最为通用;黑盘极其稳定,但是在运行过程中声音较大;红盘多用服务器数据存储,声音较小。故在第一套标准版配置中选择家用蓝盘即可,在第二套土豪级配置中最为高端稳定的黑盘作为存储盘,同时金盘也是不错的选择。

7. GPU

Tesla GPU性能很强劲,双精度计算能力非常优秀,适用于研究深度学习的超级计算机,但是Tesla K卡(K40,K80)十分昂贵,K40的价格为27000,K80的价格为37000。据一部分科研工作者反馈,对于网络计算的精度不需要达到这么高。

国内的公司和科研机构一般是使用一块Titan X Pascal,或者是两块GTX 1080,随着新品的面世,GTX1080 TI也是一个不错的选择。

GPU是计算的关键要素,利用台式机GPU来研究深度学习,就是通过足够的CUDA单元,以及配套的显存资源,来进行深度计算。尽管GPU也存在频率和显存带宽的差异,但是对于大部分的网络训练,6G及以上都是满足要求的。下图是对常用显卡的一个比较,可见如果是大量扩展时,1080TI和1070是比较合适的。

在标准版配置中,只能上一块GPU,建议显存大于等于6G,版本高于等于GTX 1060,即可满足日常实验研究,训练VGG网络或者Alexnet网络都不是问题。

上升到X99工作站主板后,最多可插两块Titan X或者四块 GTX 1080TI(当然仍然可以使用GTX 1080),上面选择的PCI-e总线为40的规定用于此处。

GTX1080 8G显存的价格是4100元左右;GTX 1080 TI显卡的价格是5700元左右,性能可以和Titan X相媲美,目前性价比最高;Titan X 12G显卡的价格是9700元,比较适用单次任务显存占用量高的网络,运行速度大约是GTX1080的1.6倍。

因此,我们在第二套土豪版配置中上了一块TITAN X,当然你也可以换成GTX 1080 TI,这也是不错的选择,根据实际训练情况再进行添置GPU。

特别需要注意的是,千万别买同级别的AMD卡!

NVida对深度学习计算的支持远远好于AMD,不然你会沉浸于无穷无尽的加速库安装和环境配置之中。

8. 电源

电源最高功率的计算可以通过鲁大师的功率计算功能得出,将得到的功率乘以1.4倍就是所需要购买的实际电源瓦数。

在第一种标准版配置中,实际功率大约为150+150+100=400w,保留充足的余量,选择海盗船VS650w的电源。

在第二种土豪版配置中,实际功率大约为250+150+100=500w,选择USCorsair RM750x金牌电源。如果你的台式机可能后期会添加显卡,那么你可能要考虑到这个问题,最多加装两个TITAN X的话,1000w电源已经足够了。

9. CPU散热器

考虑到台式机运行过程中CPU散热量较大,可以进行加装CPU风冷,如第一套配置里所用的,也可以进行加装CPU水冷,在第二套土豪级配置中用到了海盗船的水冷散热器。

以上是对深度学习装备的分析,以及面对8000和20000元分别推荐的配置清单。

其实,作者自己曾经花费4万元组装了一台深度学习工作站,更土豪的朋友可以点击阅读原文查看知乎上所提到的具体配置,或者进群一起讨论性能更高的配置方案。

本文分享自微信公众号 - 量子位(QbitAI),作者:好好学习

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-03-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 打开深度神经网络黑箱:竟是模块化的?图聚类算法解密权重结构 | ICML 2020

    我们都知道深度神经网络性能十分强大,但具体效果为什么这么好,权重为什么要这么分配,可能连“设计者”自己都不知道如何解释。

    量子位
  • 从RedHat到MongoDB,开源商业软件是如何占领世界的

    如今开源软件已经遍地开花,其中独角兽就有估值65亿美元的Mulesoft、估值40亿美元的MongoDB等。IBM去年也以320亿美元收购了Redhat。

    量子位
  • 如何用TensorFlow构建RNN?这里有一份极简的教程

    王小新 编译自 KDnuggets 量子位 出品 | 公众号 QbitAI 本文作者Erik Hallström是一名深度学习研究工程师,他的这份教程以Echo...

    量子位
  • 【解读数据中台】数据中台之前世今生与多视角解读

    有迹可循的大数据思想萌芽,可追溯至1974年,当时有学者在论文中首次提出了“大数据集”的概念,但一直到1991年,Bill Inmon出版了《建立数据仓库》一书...

    jeddili
  • 移动广告SDK InMobi推出流视频广告,将原生和视频广告进行深度结合

    备受关注的原生信息流广告或许将在今年迎来大爆发。近期,全球最大的独立移动广告平台InMobi发布了其最新产品——原生信息流视频广告,这与此前图文形式的原生信息流...

    BestSDK
  • 前端基础知识概述 -- 移动端开发的屏幕、图像、字体与布局的兼容适配

    前端的一大工作内容就是去兼容页面在不同内核的浏览器,不同的设备,不同的分辨率下的行为,使页面的能正常工作在各种各样的宿主环境当中。

    Sb_Coco
  • spark中的rdd的持久化

    rdd的全称为Resilient Distributed Datasets(弹性分布式数据集) rdd的操作有两种transfrom和action。 tra...

    Albert陈凯
  • 【工具】Excel,SPSS和QlikView等数据可视化产品选型指南

    大数据的核心不是“大”,也不是“数据”,而是蕴含在其中的商业价值。作为挖掘数据背后潜在价值的重要手段,商业智能和分析平台成为大数据部署中的 关键环...

    小莹莹
  • 张涵诚关于数据中台的十问十答

    数据中台最近讨论非常火热,本文总结了数据中台最常见的10个问题并一一作答,便于读者更好的理解数据中台的内涵。

    数据猿
  • 数据可视化产品选型指南

    大数据文摘

扫码关注云+社区

领取腾讯云代金券