ubuntu16 CUDA 编译opencl caffe版本并通过mnist训练测试

一般来说,大家谈到caffe,都是基于CUDA在的NVIDIA显卡上运行的版本,其实有一个支持opencl的分支版本OpenCL Caffe。理论上这个版本的caffe可以运行在支持OpenCL并行计算框架的任何设备上(不限于显卡),因为这个分支版本目前还是试验性版本,所以之前一直没有尝试使用,今天想起来就试着在NVIDIA显卡编译OpenCL Caffe。 这里记下编译过程:

硬件配置

神舟Z7M-SL7D2笔记本 CPU Core i7-6700HQ(含集成显卡) 芯片组 Intel Hm170 独立显卡 NVIDIA GTX965M

软件环境

ubuntu 16.04 NVIDIA driver 378 CUDA8.0

安装OpenCL

对于NVIDIA显卡,只要正常安装了CUDA,就自动包含了OpenCL的支持,所以不需要另外的安装。

如果是Intel,AMD或其他的GPU显卡,就要安装相应的OpenCL支持,可以去对应的官网下载。

编译环境准备

安装编译OpenCL Caffe所需的依赖库,大部分依赖库与CUDA下编译是一样的,参见我的另一篇博文《Ubuntu16:cmake生成Makefile编译caffe过程(OpenBLAS/CPU+GPU)#编译环境准备》

#!/bin/bash
sudo apt-get install cmake cmake-gui #安装 cmake
sudo apt-get install libprotobuf-dev protobuf-compiler libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev 
sudo apt-get install libboost-all-dev   // 安装boost库
#sudo apt-get install libatlas-base-dev  //BLAS如使用OpenBLAS,可不安装
sudo apt-get install libopenblas-dev    //BLAS如使用atlas,可不安装
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install python-numpy  // 安装numpy
#sudo apt-get install doxygen // doxygen用于文档生成 可不安装

唯一不同的是需要安装ViennaCL,ubuntu下安装ViennaCL也很简单:

sudo apt-get install libviennacl-dev

ViennaCL是一个用于并行矩阵计算库,ViennaCL在后台支持OpenCL、OpenMP和CUDA。

下载并编译Caffe

#!/bin/bash
# 下载Caffe代码到本地
git clone --recursive https://github.com/BVLC/caffe.git
# 检出opencl分支版本
git checkout opencl
cd caffe && mkdir build && cd build
# 在build下执行cmake生成Makefile 
# 指定BLAS使用OpenBLAS
cmake -DBLAS=Open .. 
# 如果使用atlas 则更简单
# cmake .. 
# 编译caffe 并发8线程 提高编译速度
make -j 8 
# 编译并安装到build/install文件夹下 
# make install -j 8
# 编译成功后可以运行测试程序检查正确性
# make runtest

经编译成功后运行ldd显示,caffe已经是基于cuda下的OpenCL动态库版本

MNIST训练测试

OpenCL Caffe编译成功后可以运行mnist手写体数字识别训练测试一下效果:

#!/bin/bash
cd caffe
# 下载MNIST训练数据
./data/mnist/get_mnist.sh
# 创建imdb格式数据
./examples/mnist/create_mnist.sh
# 开始训练
./build/tools/caffe  train --solver=examples/mnist/lenet_solver.prototxt
训练过程中运行nvidia-smi,显示GPU已经在满速运行中

参考

《Caffe-OpenCL在ubuntu16.04.2上的简要安装指南》

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Sorrower的专栏

GPU编程(二): GPU架构了解一下!

http://html.rhhz.net/tis/html/20150101.htm# http://hustcat.github.io/gpu-archit...

1082
来自专栏吉浦迅科技

DAY13:CUDA C Runtime之统一虚拟地址空间及进程间通信

1353
来自专栏Petrichor的专栏

opencv: 安装 & 可能遇到的问题 & 解决方案

  参照官网安装教程即可,其他任何的个人安装攻略都只能是辅助参考。盲从有风险,安装需谨慎。

1372
来自专栏吉浦迅科技

NVIDIA正式宣布CUDA 6:支持统一寻址

NVIDIA今天正式宣布了最新版并行计算开发工具CUDA 6,相比此前的CUDA 5.5有着革命性的巨大进步。 NVIDIA表示,CUDA 6可以让并行编程前所...

2848
来自专栏Hadoop实操

如何在CDSW中使用GPU运行深度学习

1382
来自专栏DeveWork

WordPress RSS Feed 优化/设置技巧六则

本站DeveWork.com 在之前已经分享过不少有关 RSS Feed 优化、设置技巧,今天在这里分享多篇来自网络上的文章,攫取相关重要内容,加上之前的汇总为...

1759
来自专栏王小雷

Ubuntu17.04安装TensorFlow1.2的GPU版本

摘要:Ubuntu17.04安装TensorFlow1.2的GPU版本。首先验证nvidia显卡,然后安装CUDA Toolkit 8.0,安装cuDNN v5...

2705
来自专栏生信技能树

【直播】我的基因组 30:使用软件把变异分类—添加tag

前面我们讲解了VCF文件的基础信息,其中第8列的信息可以无限丰富,但是通常我们的call variation的软件默认只给出有限的信息,有的甚至都不会告诉你该变...

34811
来自专栏吉浦迅科技

DAY89:阅读Unified Memory Programming

我们正带领大家开始阅读英文的《CUDA C Programming Guide》,今天是第89天,我们正在讲解Unified Memory Programmin...

273
来自专栏Kubernetes

如何在Kubernetes集群中利用GPU进行AI训练

Author: xidianwangtao@gmail.com 注意事项 截止Kubernetes 1.8版本: 对GPU的支持还只是实验阶段,仍停留在A...

4497

扫码关注云+社区