首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

build the deep learning environment from zero to 1

机缘巧合,因为工作的关系,笔者得以能够接触搭建基于gpu的深度学习框架的整个过程。从攒机开始,笔者使用的机器是sugon的天阔系列W580,内存128g,可以使用的硬盘空间有5T左右。如下图所示,图中红色线框就是放置

Gpu的位置,其实W580系列是支持4路gpu的。接下来我们就需要将Tesla P4的显卡放置在插槽上,进行安装。

Tesla系列是nvidia系列里面比较高端的系列,价值不菲。接下里就需要重新安装操作系统了,鉴于ubuntu16.04的使用较为广泛,那就ubuntu16.04好啦。

为了不至于讲述的过于凌乱,还是画一个流程图比较好。

到这里,我们默认已经进行到第三个步骤,前面两个步骤已经完成。

配置ip

在配置ip之前,首先看看机器上面有多少个网卡

然后我们选择其中的一块网卡来做相应的配置

vim /etc/networl/interfaces

将eno1配置成为dhcp自动获取模式,完成以后可以运行ifup eno1,启动网卡服务。

接下来就可以使用ifconfig命令查看ip地址。

安装cuda

在安装cuda之前,首先需要确认GPU显卡是否安装成功,通过

lspci grep NVIDDA来查看,

后者使用命令nvidia-smi来查看

同样也可以看到GPU的信息。

安装显卡驱动

安装cuda,这个时候就按照nvidia的官网上的教程一步步来就ok啦。

不得不提一下,这里有两种方式去安装cuda,一种下载cuda的sh脚本进行online安装,另一种则是现将cuda的deb文件下载好,然后可以进行离线安装。

cuda Toolkit是nvidia提供的CUDA开发套件,其中包含了编写cuda程序所必需的库文件和头文件,以及一些辅助函数库。

安装cudnn

cudnn之所以这样命名,是因为后面三个字母dnn其实是deep neural network意思,顾名思义,就是基于CUDA Toolkit编写的专门面向神经网络的Gpu加速库。比如网络的feedforward和backward计算库等等。所以在此之前,需要去官网上下载相应的cudnn文件。

安装anconda

anaconda是python的一个集成开发环境,对于用户非常的友好,笔者非常喜欢这样的环境,所以就安装了相应环境。安装python2.7系列

wget https://repo.continuum.io/archive/Anaconda2-5.0.1-Linux-x86_64.sh

执行以上命令进行安装,该程序会自动的将python的环境变量写入到bashrc里面。

然后

更改配置

可以安装以上配置想做相应的改变

安装gpu-tensorflow

sudo pip install gpu-tensorflow

等待安装完成。

test环境

同样的可以在notebook中做一个测试。

哈哈,同样是可以的,那么,done!游戏时间到,请诸位尽情玩耍。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180112G0O7UN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券