深度学习GeForce GTX 1080/Titan X(Maxwell)/ Titan X (Pascal)比较

【新智元导读】深度学习计算该买哪款GPU,选择哪个平台?这篇文章为你提供对比指南。

购买用于运行深度学习算法的硬件时,我们常常找不到任何有用的基准,唯一的选择是买一个GPU然后用它来测试。现在市面上性能最好的GPU几乎都来自英伟达,但其中也有很多选择:是买一个新出的TITAN X Pascal还是便宜些的TITAN X Maxwell,又或是GTX 1080?本文中我们对几个最常见的英伟达GPU以及最常用的一些深度学习算法进行了基准测试。软件方面,我们比较了最近发布的四个开源深度学习库:Tensorflow v0.10.0、Neon v1.6.0、Caffe rc3以及caffe的英伟达版本NVcaffe v0.15.10。

GPU基准测试:GeForce GTX 1080 vs Titan X(Maxwell) vs Titan X (Pascal)

我们比较了GeForce GTX 1080、Titan X Maxwell和Titan X Pascal三款GPU,使用的深度学习库是Neon、Tensorflow和Caffe,深度学习网络是AlexNet、GoogleNet、OverFeat和VGG-A。

所有基准测试都使用64位系统,每个结果是100次迭代计算的平均时间。

基于库的测试结果

训练基准测试

使用四种库(Tensorflow,NVcaffe,Caffe,Neon)进行一次前向迭代和反向迭代的总时间[ms](越少越好)。结果如下:

推论基准测试

使用四种库(Tensorflow,NVcaffe,Caffe,Neon)进行一次前向迭代的总时间[ms](越少越好)。结果如下:

基于神经网络的测试结果

训练基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

推论基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代的总时间(越少越好)。结果如下:

配置

基准测试工具

在Neon上进行基准测试使用的是neon库中的脚本neon/tests/run_benchmarks.py,在Tensorflow上使用的是convnet-benchmarks和不加修改的脚本convnet-benchmarks/tensorflow/benchmark_alexnet.py, convnet-benchmarks/tensorflow/benchmark_googlnet.py, convnet-benchmarks/tensorflow/benchmark_overfeat.py 以及 convnet-benchmarks/tensorflow/benchmark_vgg.py。Caffe使用的也是convnet-benchmarks,但对脚本convnet-benchmarks/caffe/run_imagenet.sh作了修改以指向我们的caffe安装。

深度学习库基准测试:Caffe vs Neon vsNVcaffe vs Tensorflow

同样,所有基准测试都使用64位系统,每个结果是100次迭代计算的平均时间。

基于GPU的测试结果

训练基准测试

使用四种GPU(Titan X Pascal, Titan X Maxwell, GeForce GTX 1080)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

推论基准测试

使用四种GPU(Titan X Pascal, Titan X Maxwell, GeForce GTX 1080)进行一次前向迭代的总时间(越少越好)。结果如下:

基于神经网络的测试结果

训练基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

推论基准测试

使用四种神经网络(VGG-A, OverFeat, AlexNet,GoogLeNet)进行一次前向迭代的总时间(越少越好)。结果如下:

配置

基准测试工具

在Neon上进行基准测试使用的是neon库中的脚本neon/tests/run_benchmarks.py,在Tensorflow上使用的是convnet-benchmarks和不加修改的脚本convnet-benchmarks/tensorflow/benchmark_alexnet.py, convnet-benchmarks/tensorflow/benchmark_googlnet.py, convnet-benchmarks/tensorflow/benchmark_overfeat.py 以及 convnet-benchmarks/tensorflow/benchmark_vgg.py。Caffe使用的也是convnet-benchmarks,但对脚本convnet-benchmarks/caffe/run_imagenet.sh作了修改以指向我们的caffe安装。

原文发布于微信公众号 - 吉浦迅科技(gpusolution)

原文发表时间:2016-10-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CVer

风格迁移三部曲(二)之固定风格任意内容的快速风格迁移

上篇介绍了风格迁移三部曲(一)之普通风格迁移,本文将继续介绍第二种风格迁移方式:固定风格任意内容的快速风格迁移。

19300
来自专栏Coding迪斯尼

用python实现数字图片识别神经网络--实现网络训练功能

20830
来自专栏深度学习那些事儿

深度学习中数据集很小是一种什么样的体验

今天提一个比较轻松的话题,简单探讨数据集大小对深度学习训练的影响。 不知道大家有没有看过这篇文章:Don’t use deep learning your d...

2.2K40
来自专栏杨熹的专栏

TensorFlow-5: 用 tf.contrib.learn 来构建输入函数

学习资料: https://www.tensorflow.org/get_started/input_fn 对应的中文翻译: http://studyai....

38770
来自专栏用户2442861的专栏

Torch深度学习入门

lua和torch的安装官网都有,lua的语法基础知识网上有很多。请看本文前自行学习。本文简单介绍了torch做深度学习模型的简单用法,并给出了CIFAR-10...

13820
来自专栏Coding迪斯尼

依赖反向传播改进神经网络数据处理的精确度

14040
来自专栏Python小屋

Python使用tensorflow中梯度下降算法求解变量最优值

TensorFlow是一个用于人工智能的开源神器,是一个采用数据流图(data flow graphs)用于数值计算的开源软件库。数据流图使用节点(nodes)...

36680
来自专栏杨熹的专栏

LightGBM 如何调参

1.2K40
来自专栏PPV课数据科学社区

K-means 在 Python 中的实现

K-means算法简介 K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,...

37690
来自专栏ATYUN订阅号

正则化贪心森林(RGF)的入门简介,含案例研究

作为曾参与机器学习竞赛的数据科学家,我一直在寻找“非主流”的算法。使用这些算法可能不会成为竞争的赢家。但是他们有独特的预测方式。这些算法可以在集成模型中使用,以...

53460

扫码关注云+社区

领取腾讯云代金券