前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >VGG(2014),3x3卷积的胜利

VGG(2014),3x3卷积的胜利

作者头像
李拜六不开鑫
修改2020-04-26 16:04:53
6360
修改2020-04-26 16:04:53
举报
文章被收录于专栏:本立2道生本立2道生

目录

博客:blog.shinelee.me | 博客园 | CSDN

写在前面

VGG(2014)网络出自paper《Very Deep Convolutional Networks for Large-Scale Image Recognition》,为ILSVRC2014 localization冠军和classification亚军方法(冠军为GoogLeNet),首次提交arXiv时间为2014年9月,后发表在ICLR2015,截止20191011引用量达27612。因为出自牛津大学Visual Geometry Group,所以网络被命名为VGG,根据层数不同,又分为VGG16、VGG19等。

VGG citations
VGG citations

网络结构

文中列举了配置不同的5个网络,分别命名为A、A-LRN、B、C、D、E,网络结构及参数量如下图所示,

VGG configurations
VGG configurations

paper中的实验均在上述网络中进行,下面具体看一下。

multi-scale training and testing

single test scale
single test scale
multiple test scales
multiple test scales

上面的对比实验,可得出以下结论:

  • 随着深度增加,性能变好
  • 与A相比,A-LRN性能没有改善,LRN用途不大
  • 无论是training还是testing,multiple scale均能改善性能,两者结合使用效果更佳
  • 在当前数据集和网络结构配置上,VGG16(D)和VGG19(E)性能基本一样,接近饱和

对于multi scale对性能的改善,想来也是合理的,因为图像中目标的尺寸并不确定,有大有小,在训练阶段通过scale jittering来增广数据,可让网络在一定程度上cover这种变化,而在预测阶段,multi scale可以看成在输入数据上做的集成学习,亦是提升性能的常规操作。

其他有意思的点

论文中还有一些其他有意思的点,简单总结如下,

  • 为了网络能正常收敛,权重的初始化很重要,原来是先训练浅层网络A,然后用A的权重初始化后面深层网络前4个卷积层和最后3个全连接层,其他层从高斯分布中随机初始化。在paper submission后发现,直接采用Understanding the difficulty of training deep feedforward neural networks中的初始化方法就可以,即Xavier方法
  • paper中评论,因为A-LRN中的Local Response Normalisation(LRN)没有效果,还增加了内存使用和计算量,所以后面的BCDE网络就不用了(微笑)。
  • 在ILSVRC-2014 challenge中,VGG提交的是7模型融合结果,提交后他们测试2模型的融合结果要更好,top1 val好1%,top5 val好0.5%,不过是在multi-scale traing、multi-crop和dense一起加成下取得的结果。
  • VGG (1 net, multi-crop & dense eval) 单网络比GoogLeNet单网络的性能要好约1%。
  • 2014年,ImageNet竞赛Top5错误率首次进入0~10%区间。

以上。

参考

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-10-14 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 写在前面
  • 网络结构
  • multi-scale training and testing
  • 其他有意思的点
  • 参考
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档