前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >资源 | 用苹果Core ML实现谷歌移动端神经网络MobileNet

资源 | 用苹果Core ML实现谷歌移动端神经网络MobileNet

作者头像
机器之心
发布2018-05-08 13:49:53
8720
发布2018-05-08 13:49:53
举报
文章被收录于专栏:机器之心

选自GitHub

机器之心编译

作者:Matthijs Hollemans

参与:李泽南

6 月 5 日开幕的 WWDC 2017 开发者大会上,苹果正式推出了一系列新的面向开发者的机器学习 API,包括面部识别的视觉 API、自然语言处理 API,这些 API 的背后都有 Core ML 机器学习框架的身影。苹果软件主管兼高级副总裁 Craig Federighi 在大会上介绍说,Core ML 致力于加速在 iPhone、iPad、Apple Watch 等移动设备上的人工智能任务,支持深度神经网络、循环神经网络、卷积神经网络、支持向量机、树集成、线性模型等。这一框架的易用性如何?大会之后,开源社区中很快就出现了有关 Core ML 的实现。

MobileNet 在 Core ML 上的实现

MobileNet 是谷歌在 2017 年 4 月发表的一项研究,它是一种高效、小尺寸的神经网络架构,适用于构建手机/移动设备上的低延迟深度学习应用,并可以完成多种不同任务。

Core ML 实现链接:https://github.com/hollance/MobileNet-CoreML

本实现是论文《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications》中神经网络架构 MobileNet 的苹果 CoreML 框架实现。它使用了 MobileNet-Caffe 中的预训练内容。

想使用这个 app,请在 Xcode 9 中打开 MobileNetCoreML.xcodeproj,并在 iOS11 系统或同版本的模拟器中运行。目前,它只能用于识别猫的图片,实时视频的识别将在稍后加入(可以看看 Forge:https://github.com/hollance/Forge,一个用于 iOS10 的 Metal 神经网络工具包,和 MobileNet 共同使用可以处理视频)。

模型迁移

这个版本已经包含了完整的 MobileNet.mlmodel,所以你不必遵循这一章节的所有步骤。当然,如果你希望尝试,以下是如何将原版 Caffe 模型转换到.mlmodel 文件中的方法:

1. 从 Caffemodel 文件中下载模型,放到本项目中的根目录下。(注意,你不必下载 mobilenet_deploy.prototxt,它在本项目中已经存在。该实现作者还在尾部加入了一个原版缺失的 Softmax 层)

原 Caffe 实现连接:https://github.com/shicai/MobileNet-Caffe

2. 在终端加入如下代码:

代码语言:javascript
复制
$ virtualenv -p /usr/bin/python2.7 env
$ source env/bin/activate
$ pip install tensorflow
$ pip install keras==1.2.2
$ pip install coremltools

使用/usr/bin/python2.7 设置虚拟环境非常重要,如果你在使用其他版本的 Python,则转换脚本会崩溃——Fatal Python error: PyThreadState_Get: no current thread;同时,你需要使用 Keras 1.2.2 版本,而不是更新的 2.0 版。

3. 运行 coreml.py 脚本进行转换:

代码语言:javascript
复制
$ python coreml.py

这会生成 MobileNet.mlmodel 文件。

4. 通过禁止 virtualenv 进行清理:

代码语言:javascript
复制
$ deactivate

论文:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

论文链接:https://arxiv.org/abs/1704.04861v1

摘要

我们提出了 MobileNets:一种用于移动端和嵌入式视觉应用的新模型。它基于一种流线型架构,使用深度可分离卷积方法来构建轻量级深度神经网络。我们引入了两个简单的全局超参数,可以在延迟和准确性之间找到平衡点。这些超参数允许模型开发者针对应用面临的局限性选择正确尺寸的模型。在 ImageNet 分类任务中,我们的模型具有资源消耗和精度的平衡性,并展示了颇具竞争力的性能。我们也展示了 MobileNets 在多种不同应用中的有效性,其中包括物体检测、粒度分类、面部属性和大规模地理定位。

MobileNets 可以应用于多种识别任务,让设备实现智能化

©本文为机器之心编译,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-06-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档