Dilated Convolutions——扩张卷积

1. 扩张卷积

Dilated Convolutions,翻译为扩张卷积或空洞卷积。扩张卷积与普通的卷积相比,除了卷积核的大小以外,还有一个扩张率(dilation rate)参数,主要用来表示扩张的大小。扩张卷积与普通卷积的相同点在于,卷积核的大小是一样的,在神经网络中即参数数量不变,区别在于扩张卷积具有更大的感受野。感受野是卷积核在图像上看到的大小,例如3×33 \times 3卷积核的感受野大小为9。

2. 示意图

下图是扩张卷积的示意图。

(a) 普通卷积,1-dilated convolution,卷积核的感受野为3×3=93 \times 3 = 9。 (b) 扩张卷积,2-dilated convolution,卷积核的感受野为7×7=497 \times 7 = 49。 (c) 扩张卷积,4-dilated convolution,卷积核的感受野为15×15=22515 \times 15 = 225。

从上图中可以看出,卷积核的参数个数保持不变,感受野的大小随着“dilation rate”参数的增加呈指数增长。

3. 优点

扩展卷积在保持参数个数不变的情况下增大了卷积核的感受野,同时它可以保证输出的特征映射(feature map)的大小保持不变。一个扩张率为2的3×3卷积核,感受野与5×5的卷积核相同,但参数数量仅为9个,是5×5卷积参数数量的36%36\%。

4. 应用

扩张卷积在图像分割、语音合成、机器翻译、目标检测中都有应用。

5. 参考资料

Multi-Scale Context Aggregation by Dilated Convolutions

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏计算机视觉战队

特征金字塔特征用于目标检测

前言: 这篇文章主要使用特征金字塔网络来融合多层特征,改进了CNN特征提取。作者也在流行的Fast&Faster R-CNN上进行了实验,在COCO数据集上测...

3497
来自专栏AI科技评论

深度 | 传说中的贝叶斯统计到底有什么来头?

贝叶斯统计在机器学习中占有一个什么样的地位,它的原理以及实现过程又是如何的?本文对相关概念以及原理进行了介绍。 引言:在很多分析学者看来,贝叶斯统计仍然是难以理...

3075
来自专栏磐创AI技术团队的专栏

谱聚类概述

1333
来自专栏机器之心

入门 | 今天是雾霾,明天是什么?马尔可夫链告诉你

选自towardsdatascience 作者:Devin Soni 机器之心编译 参与:Nurhachu Null、刘晓坤 什么是马尔可夫链?什么时候应该使用...

2765
来自专栏机器之心

学界 | 双重注意力网络:中科院自动化所提出新的自然场景图像分割框架(附源码)

作者:Jun Fu、Jing Liu、Haijie Tian、Zhiwei Fang、Hanqing Lu

1302
来自专栏大数据互联网思维

如何使用MaskRCNN模型进行图像实体分割

目标检测是计算机视觉和模式识别的重要研究方向,主要是确定图像中是否有感兴趣的目标存在,并对其进行探测和精确定位。传统的目标检测流程采用滑动窗口进行区域选择,然后...

963
来自专栏机器学习算法全栈工程师

Mask-RCNN论文解读

Mask R-CNN是基于Faster R-CNN的基于上演进改良而来,FasterR-CNN并不是为了输入输出之间进行像素对齐的目标而设计的,为了弥补这个不足...

6308
来自专栏美图数据技术团队

科普 | 贝叶斯概率模型一览

机器学习狭义上是指代统计机器学习,如图 1 所示,统计学习根据任务类型可以分为监督学习、半监督学习、无监督学习、增强学习等。

1114
来自专栏深度学习自然语言处理

简单理解Momentum,RMSprop,Adam优化算法

我们初学的算法一般都是从SGD入门的,参数更新是: ? 它的梯度路线为: ? 但是可以看出它的上下波动很大,收敛的速度很慢。因此根据这些原因,有人提出了Mome...

37714
来自专栏人工智能LeadAI

目标检测研究综述+LocNet

01 localization accuracy ? ? 更准确的bounding box,提高IOU 02 目标检测的发展 1、传统的目标检测(滑动窗口的...

3775

扫码关注云+社区