开发 | 谷歌开源计算机视觉模型MobileNets:专为不同级别移动设备优化

AI 科技评论消息,谷歌刚刚对外发布了开源计算机视觉模型MobileNets。MobileNets是一系列为移动和嵌入式设备设计的计算机视觉模型,它可以利用设备有限的资源高效运行,并提供尽可能高的准确率。

AI 科技评论从谷歌开源博客了解到了更多信息,介绍如下。

在深度学习的支持下,计算机视觉近几年得到了突飞猛进的发展,神经网络的使用不断把识别视觉技术推上新的高度。虽然目前包括识别物体、地标、logo、文字在内的许许多多计算机视觉技术都是通过云视觉API进行计算然后把结果显示在互联网设备上的,谷歌的研究人员认为,移动设备持续高速增长的计算能力已经可以让这些技术随时随地、不受网络限制地给用户提供服务。

不过,在手持设备和嵌入式应用上做视觉识别目前还有不少困难,在这样资源及其有限的环境下,视觉识别模型需要高效利用计算能力、能源和空间,高速运行并且保证准确率。

为了尝试解决这些问题,谷歌于美国时间6月14日发布了MobileNets。MobileNets是一系列为移动设备设计、用在TensorFlow中的计算机视觉模型,它们的设计目标是在手持或者嵌入式设备有限的资源下高效地运行,提供尽可能高的准确率。MobileNets中的一系列模型都是小型、低延迟、低耗能的模型,它们为多种不同使用场景下的有限资源做了针对性的参数优化。开发者可以像用Inception这样的大型热门模型一样地用MobileNets中的模型进一步开发分类、识别、嵌入和细分功能。

基于MobileNets在移动设备上进行检测、细粒度分类、属性和地标检测应用的例子

这个MobileNets版本包含了这些模型在TensorFlow中的定义(具体使用的是TF-Slim),也包含16个已经训练好的ImageNet分类器,它们分别适用于不同大小的移动设备或者移动应用中。这些模型配合TensorFlow Mobile可以在移动设备上高效地运行。

谷歌建议根据自己的延迟和项目大小需求选取适合的模型。网络模型在内存和磁盘中所占的空间大小和网络中参数的数量成正比。用MACs值(Multiply-Accumulates,累积乘法量,用来衡量乘法、加法融合计算的数量)可以估计网络的延迟和能源消耗。Top-1和Top-5准确率是通过ILSVRC数据库测试得出的。

现在MobileNets已经共享到开源社区,谷歌的研发人员们对此表示很开心。

MobileNets如何上手,请见 TensorFlow-Slim Image Classification Library

( https://github.com/tensorflow/models/blob/master/slim/README.md )

如何在移动设备运行机器学习模型,请见 TensorFlow Mobile ( https://www.tensorflow.org/mobile/ )

谷歌的论文里有更多技术细节 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. ( https://arxiv.org/abs/1704.04861 )

后续报道,请继续关注 AI 科技评论

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-06-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

深度| OpenAI 教你如何构建深度学习研究的基础设施

编者按:OpenAI研究工程师Vicki Cheung, Jonas Schneider , Ilya Sutskever, and Greg Brockman...

3516
来自专栏新智元

Google Play:使用深度学习,根据用户环境实现个性化 App 推荐

【新智元导读】本文是 Google Play 的 “App 发现”系列文章的第二篇,谷歌 App发现团队讨论了如何使用深度学习,根据用户曾经下载过的 App 和...

4598
来自专栏朱云龙的专栏

【SPA大赛】SPA大赛数据探索与解题思路

本次腾讯社交广告算法大赛以移动app广告转化率预估为背景,以移动App广告为研究对象,预测App广告点击后被激活的概率:即给定广告、用户和上下文情况下广告被点击...

2090
来自专栏量子位

国际象棋版AlphaZero出来了诶,还开源了Keras实现ヽ( `0´)ノ

只用了不到4小时。 AlphaZero在去年底通过自我对弈,就完爆上一代围棋冠军程序AlphaGo,且没有采用任何的人类经验作训练数据(至少DeepMind坚持...

3405
来自专栏目标检测和深度学习

厉害了,我用“深度学习”写了个老板探测器(附源码)

如果上班的时候想放松一下,或者直说想偷偷懒,看点和工作无关的网页,这时候万一老板突然出现在背后,会不会感到很难堪呢? 有的浏览器设置了boss按键,手快的人还可...

2827
来自专栏MixLab科技+设计实验室

你该掌握的AI技能:强化学习01

题图由人工智能设计师完成 最近在看一些强化学习的书籍,学习的过程就是要不断的输入,查找资料,理解各种资料,然后输出,总结学习心得,再次输入,输出。不断的重复输入...

2686
来自专栏AI研习社

教你用 Python 和 Keras 建立自己的 AlphaZero

作者David Foster。 翻译 | 黄伟聪 董星 校对 | 凡江 ? 在这篇文章,我会试着阐明三件事: AlphaZero之所以是人工智能前...

3599
来自专栏大前端开发

【趣解编程】函数

编写一个函数的过程,就是你生产一台加工机器的过程,你决定了这台加工机器是如何工作的,要做什么事情。

563
来自专栏AI科技评论

深度 | 基于移动设备的机器学习,本地与云端孰优孰劣?

AI科技评论按:如果您觉得,是时候给自己的手机应用添加一些热门的机器学习或深度学习算法.....这是个好想法!但您会怎么选择?致力于提供算法服务及小白科普的咨询...

2616
来自专栏新智元

谷歌开源超大型视频数据库,含800万视频 (附技术报告)

9月28日,谷歌在官方博客上宣布,将含有800万个Youtube 视频URL 的视频数据库开源,视频总时长达到了50万个小时。一并发布的还有从包含了4800个知...

3416

扫描关注云+社区