开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

OpenCV 基于Inception模型图像分类

文章来源：企鹅号 - OpenCV学堂

Network in Network（NIN）

要介绍Inception网络结构首先应该介绍一下NIN(Network in Network)网络模型，2014年新加坡国立大学发表了一篇关于计算机视觉图像分类的论文，提到采用了一种新的网络结构NIN实现图像分类，该论文的第二作者颜水成毕业于北京大学数学系，现任360人工智能研究院院长与首席科学家。NIN主要思想是认为CNN网络中卷积滤波是基于线性滤波器实现的，抽象能力不够，所以一般是用一大堆filter把所有特征都找出来，但是这样就导致网络参数过大，论文作者提出通过MLP（多个权重阶层组成+一个非线性激活函数）对输入区域通过MLP产生一个输出feature map，然后继续滑动MLP窗口，对比如下：

这样做有两个好处，

MLP可以共享参数，减少参数总数

对每个局部感受野神经元实现更加复杂计算，提升能力

论文中提到NIN网络完整结构如下：

包含了三个MLP卷积层与一个全局池化层。

前方高能预警，干货在后面！Inception v1

受到这篇文章的影响与启发，谷歌在2014也提出一个新的网络模型结构Inception网络也就是大家熟知v1网络，其主要贡献在于实现了NIN网络层数的增加，并且在训练各个网络时候为了提高收敛，考虑中间层的输出与最终分类错误。只是中间层不同，最初inception网络的中间层为：

后来发现3x3与5x5的卷积计算耗时很长，而且输出导致卷积厚度增加，如果层数过度将导致卷积网络不可控制，于是就在3x3与5x5的卷积之前分别加上1x1的卷积做降维，修改后的结构如下：

最终得到v1版本的网络结构如下：

Inception v2 and Inception v3

于是在v1的基础上作者继续工作，加入了BN层，对大于3x3的卷积用一系列小的卷积进行替代，比如7x7可以被1x7与7x1替代两个小卷积核，5x5可以被1x5与5x1两个小卷积核替代，这样就得到Inception v2的版本。于是作者继续对此网络结构各种优化调整，最终又得到了Inception v3版本

Inception v4

Inception v4一个最大的改动就是引入了残差网络结构，对原有的网络结构进行优化，得到v1与v2的残差版本网络结构，最终得到一个更加优化的v4模型，完整的v4结构：

对应的Block A、B、C结构如下：Inception-A

Inception-B

Inception-C

v1模型加残差网络结构

OpenCV DNN模块中使用Inception模型

下载Inception预训练网络模型

使用OpenCV DNN模块相关API加载模型

运行Inception网络实现图像分类完整的代码实现如下：

输入原图：

测试结果：

关键是速度很快，比VGG快N多，基本秒出结果！

书痴者文必工，

艺痴者技必良！

关注【OpenCV学堂】

长按或者扫码下面二维码即可关注

OpenCV深度学习

发表于: 2018-04-212018-04-21 08:26:29
原文链接：http://kuaibao.qq.com/s/20180421G08D7T00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群