专栏首页数据分析与挖掘【论文笔记】Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition

【论文笔记】Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition

地址:https://arxiv.org/pdf/2006.11538.pdf

github:https://github.com/iduta/pyconv

目前的卷积神经网络普遍使用3×3的卷积神经网络,通过堆叠3×3的卷积核和下采样层,会在减少图像的大小的同时增加感受野,使用小尺度的卷积核存在两个问题:

  • 实际感受野的大小比理论上的感受野大小要小得多。
  • 在没有获得足够的上下文信息之前就对输入图像进行下采样,会影响学习过程和网络的识别性能。由于感受野不足够大来捕获场景中不同的依赖,以至于有用的细节就损失掉了。

大体来说就是不同对象在不同场景中可能出现各种各样的大小,或者在同一场景中,相同对象也可能出现不同的大小,使用传统的3×3卷积就不能够学习到这种多样性。

主要贡献:提出了金字塔卷积,能够捕获不同层级的细节信息,该网络是有效的,与标准的卷积相比只增加了少量的参数量和计算量,并将该网络扩展到了图像分类、场景识别、语义分割、目标检测、视频分类中。

直接看金字塔卷积,很直观的就是在空间维度上,卷积核大小从上至下依次减少,在通道维度上,卷积核的数量(通道的数目)依次增加,最后这些特征图拼接起来。

这里要提一下参数量parameters和浮点数计算量FLOPs的计算公式:

K_{1}表示的是卷积核的大小,FM_{i}表示输入特征图的通道数,FM_{o} 表示输出的通道数,W、H表示输出特征图的宽和高。

另一个就是组卷积:

将特征按通道进行分组,然后分别进行卷积操作。

上述分别说明了每一个层的卷积操作所带来的参数量和浮点数计算量。

另外还强调了,为了简便创造出不同的金字塔卷积的网络,每层的金字塔卷积输入的特征图数目、每层的金字塔的分组通道数、每层的金字塔卷积的输出特征图数目最好是2的幂。

金字塔卷积网络应用在图像分类中?

瓶颈金字塔残差块:

所提出的网络结构:

需要注意的是该网络与原始的残差网络相比,去掉了最初的max pooling。也就是说现在4组卷积块都是在第一个block是进行下采样的。具体原因还是直接看英文比较好:

其余的任务就不仔细看了,知道大体架构差不多了。

金字塔卷积网络应用在语义分割中?

金字塔卷积网络应用在目标检测中?

部分结果:

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • java之==操作符和equals操作符

    说明:a1和b1指向的是同一个String,而a2和b2指向不同的String,所以a2.equals(b2)只比较值返回true,==比较引用返回false。

    绝命生
  • 【python-leetcode977-双指针】有序数组的平方

    给定一个按非递减顺序排序的整数数组 A,返回每个数字的平方组成的新数组,要求也按非递减顺序排序。

    绝命生
  • django-URL之从URL中获取关键字(七)

    绝命生
  • 万字长文带你看尽深度学习中的各种卷积网络

    AI 科技评论按:深度学习中的各种卷积网络大家知多少?对于那些听说过却又对它们没有特别清晰的认识的小伙伴们,Kunlun Bai 这篇文章非常值得一读。Kunl...

    AI科技评论
  • 卷积为什么如此强大?理解深度学习中的卷积

    译自Tim Dettmers的Understanding Convolution in Deep Learning。有太多的公开课、教程在反复传颂卷积神经网络的...

    机器人网
  • 卷积层

    深度学习基础理论-CNN篇 卷积层 卷积层(convolution layer)是卷积神经网络中的基础操作,甚至在网络最后起分类作用的全连接层在工程实现时也...

    用户1386409
  • 深度学习-卷积神经网络原理

    卷积神经网络又称作(ConvNet, CNN),它的出现解决了人工智能图像识别的难题,图像识别数据量大,并且在识别的过程中很难保留原有的信息,因此卷积的作用就体...

    用户7760819
  • 【Pytorch 】笔记五:nn 模块中的网络层介绍

    疫情在家的这段时间,想系统的学习一遍 Pytorch 基础知识,因为我发现虽然直接 Pytorch 实战上手比较快,但是关于一些内部的原理知识其实并不是太懂,这...

    阿泽 Crz
  • 技术 | 变形卷积核、可分离卷积?卷积神经网络中十大拍案叫绝的操作

    作者 | Professor ho CNN从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模型,一个比一个深,一个比一个准确,一个比一个轻量...

    AI科技大本营
  • 深度 | 理解深度学习中的卷积

    机器之心经授权转载 来源:码农场 译者按:本文译自 Tim Dettmers 的 Understanding Convolution in Deep Learn...

    机器之心

扫码关注云+社区

领取腾讯云代金券