build the deep learning environment from zero to 1

文章来源：企鹅号

机缘巧合，因为工作的关系，笔者得以能够接触搭建基于gpu的深度学习框架的整个过程。从攒机开始，笔者使用的机器是sugon的天阔系列W580，内存128g，可以使用的硬盘空间有5T左右。如下图所示，图中红色线框就是放置

Gpu的位置，其实W580系列是支持4路gpu的。接下来我们就需要将Tesla P4的显卡放置在插槽上，进行安装。

Tesla系列是nvidia系列里面比较高端的系列，价值不菲。接下里就需要重新安装操作系统了，鉴于ubuntu16.04的使用较为广泛，那就ubuntu16.04好啦。

为了不至于讲述的过于凌乱，还是画一个流程图比较好。

到这里，我们默认已经进行到第三个步骤，前面两个步骤已经完成。

配置ip

在配置ip之前，首先看看机器上面有多少个网卡

然后我们选择其中的一块网卡来做相应的配置

vim /etc/networl/interfaces

将eno1配置成为dhcp自动获取模式，完成以后可以运行ifup eno1,启动网卡服务。

接下来就可以使用ifconfig命令查看ip地址。

安装cuda

在安装cuda之前，首先需要确认GPU显卡是否安装成功，通过

lspci grep NVIDDA来查看，

后者使用命令nvidia-smi来查看

同样也可以看到GPU的信息。

安装显卡驱动

安装cuda，这个时候就按照nvidia的官网上的教程一步步来就ok啦。

不得不提一下，这里有两种方式去安装cuda，一种下载cuda的sh脚本进行online安装，另一种则是现将cuda的deb文件下载好，然后可以进行离线安装。

cuda Toolkit是nvidia提供的CUDA开发套件，其中包含了编写cuda程序所必需的库文件和头文件，以及一些辅助函数库。

安装cudnn

cudnn之所以这样命名，是因为后面三个字母dnn其实是deep neural network意思，顾名思义，就是基于CUDA Toolkit编写的专门面向神经网络的Gpu加速库。比如网络的feedforward和backward计算库等等。所以在此之前，需要去官网上下载相应的cudnn文件。

安装anconda

anaconda是python的一个集成开发环境，对于用户非常的友好，笔者非常喜欢这样的环境，所以就安装了相应环境。安装python2.7系列

wget https://repo.continuum.io/archive/Anaconda2-5.0.1-Linux-x86_64.sh

执行以上命令进行安装，该程序会自动的将python的环境变量写入到bashrc里面。

然后

更改配置

可以安装以上配置想做相应的改变

安装gpu-tensorflow

sudo pip install gpu-tensorflow

等待安装完成。

test环境

同样的可以在notebook中做一个测试。

哈哈，同样是可以的，那么，done！游戏时间到，请诸位尽情玩耍。

发表于: 2018-01-122018-01-12 17:55:27
原文链接：http://kuaibao.qq.com/s/20180112G0O7UN00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

build the deep learning environment from zero to 1

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐