由于用于构建卷积神经网络(CNNs)的各个模块具有较为固定的几何结构,从而在根本上限制了 CNNs 算法对几何变换的建模。在《Deformable Convolutional Networks》这篇论文中,来自微软亚洲研究院的研究员们提出了两种全新的模块 Deformable convolution 和 Deformable RoI pooling 用于提升 CNNs 算法对几何变换的建模能力。
上图展示了一个 3 x 3 大小的 Deformable convolution 结构
Deformable convolution 和 Deformable RoI pooling 两种模块构建的思想分别是:
上图展示了一个 3 x 3 大小的 Deformable RoI pooling 结构
值得一提的是,这两个模块都可以轻而易举地取代现有卷积神经网络(CNNs)中的相对应模块,并且也可以通过标准的反向传播算法进行端到端(End-to-End)的训练从而产生可变形的卷积网络(Deformable convolutional networks)。
微软亚洲研究院的研究员们已经通过大量的实验验证了该新方法对于物体检测和语义分割这两个复杂视觉任务具有有效性,并且相关的实验代码也将被公开出来。
本文由AI科技评论编译,原文地址:Deformable Convolutional Networks(https://arxiv.org/pdf/1703.06211.pdf)