专栏首页吉浦迅科技GTX1080ti、Jetson NANO和树莓派跑深度学习性能差别有多大?

GTX1080ti、Jetson NANO和树莓派跑深度学习性能差别有多大?

这个问题经常被问起

最近有人在Github上发了一个评测报告,我们先来看看吧。

这个报告记录了DeepDetect开源深度学习服务在各种计算平台和流行神经网络架构上的性能。

点击阅读原文可以了解更详细的测试情况

参考平台

NVidia GTX 1080 Ti

NVidia Jetson TX1

NVIDIA Jetson NANO

Raspberry Pi 3

请注意,1080Ti和TX1使用CuDNN NVidia加速库,而TK1使用没有CuDNN的GPU加速,而Raspberry仅使用CPU。

参考网络

  • GoogleNet
  • VGG16 and VGG19
  • Resnet 50, 101 and 152
  • Densenet 121 and 201
  • Squeezenet v1.0 and v1.1
  • Mobilenet (原始Caffe版本和另一个自定义加速版本)
  • Shufflenet

先看一下测试结果:

GTX1080ti

在使用GTX1080Ti的桌面级别GPU上,大多数型号的性能都能超过25 fps。该卡有11 GB GDDR5X VRAM和3584 CUDA核,最大主频1582 MHz。这相当于11.3 tflops /s。相对嵌入式系统,桌面GPU卡有强大的实时处理性能,但其功耗在嵌入式系统应用中是不可行的。在280瓦的负载下,桌面设置适合于分析应用程序。

Jetson TX1

排名第二的是英伟达Jetson TX1。TX1在运行时的最大功耗为15w,是嵌入式系统应用程序的一个很好的候选。在1 TFLOPS理论输出时,TX1能够将squeezenet_1.0、squeezenet_v1.1、mobilenet_depthwise、googlenet和shufflenet推到超过25帧每秒。在极端情况下,对于squeezenet_v1.1, Tx1最多可以计算85帧fps,批处理大小等于或大于16。对于自动驾驶汽车等时间紧迫的项目,TX1可能是可行的解决方案。

Jetson Nano

Nano在运行时的功耗为5w,是嵌入式系统应用和IA on edge的低成本解决方案。它的输出为500 GFLOPS。批量为1时,ShuffleNet和SqueezeNet分别达到12和25 fps。Jetson Nano在运行 Squeezenet-SSD-faces, SqueezeNet-SS-voc 和ResNet18-ocr时,batch-size等于2,可以推动多达10帧每秒。当推到64批大小时,Nano可以为SqueezeNet和ResNet18-ocr计算高达48帧的帧频。对于大型项目或预算有限的项目,Jetson Nano似乎是一个有趣的解决方案。

Raspberry Pi3 model B

在只有4瓦的负载下,Pi应该是遥感的首选解决方案。缺点在于它处理图像的能力,最多只有1帧。

本文分享自微信公众号 - 吉浦迅科技(gpusolution)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 终于有人把物联网和边缘计算的关系说清楚了

    今年特别火的物联网是什么?边缘计算和物联网有什么关系?也许之前你有点搞不清,看完这篇文章相信您会对边缘计算和物联网有新的认识。

    边缘计算
  • 操作系统原理、数据结构、网络原理,深入理解计算机系统应该按什么顺序去看?

    计科专业从事软件开发多年,上面说的几本书都是学习计算机的必备知识,如果还在上大学阶段的小伙伴看到这篇文章,现在就以一个程序员的身份来讲讲这四本书在平时开发中如何...

    程序员互动联盟
  • 【工具】这么好用的代码阅读器你装了吗?

    作为一名程序员,我们不仅要多动手编代码,而且还应多阅读一些优秀的代码,如C语言的一些第三方库文件、嵌入式中Linux内核源码以及一些项目的代码等。这些源码往往都...

    正念君
  • 15个国外顶级的大数据分析工具

    嵌入式分析 在传统业务应用程序(如HR系统,CRM或ERP)的范围内提供商业智能。这些分析在用户的正常工作流程中提供上下文敏感的决策支持。

    Blue姐
  • JAVA、C、C++、Python同样是高级语言,为什么只有C和C++可以编写单片机程序?

    从事编程十几年,JAVA、C、C++、Python这四种编程语言都玩过,前三种玩的比较多,python做为兴趣爱好或者玩脚本的时候弄过,编程语言在使用的时候主要...

    程序员互动联盟
  • 最近有程序员自降80%薪水转行做游戏,那些跨行的游戏作者真的有出路吗?

    从事软件开发多年,开发游戏能加班加到人吐血,虽然普通大众都喜欢玩游戏但对于普通的游戏开发者来讲加班加点已经是家常便饭,特别是做国外优秀山寨这块基本上一周至少工作...

    程序员互动联盟
  • 中断与异常简介与分析

    在高执行级别下,代码可以执行特权指令,访问任意的物理地址,这种CPU执行级别就对应着内核态。

    morixinguan
  • 如何从零开始开发一个操作系统?

    操作算是在软件开发里面功能非常齐全难度非常大的一个超级工程,目前国内掌握操纵系统技术的科技公司也是少的可怜,而且不完全是技术层面的东西了,还需要构建生态链,国内...

    程序员互动联盟
  • 【C语言笔记】操作位的技巧

    操作位有两种方法,一种是位字段,另一种是使用按位运算符。位字段的方法可查看往期笔记:【C语言笔记】位域。本文介绍使用按位运算符操作位的方法。下表为几种位操作符及...

    正念君

扫码关注云+社区

领取腾讯云代金券