首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Dilated Convolutions——扩张卷积

Dilated Convolutions——扩张卷积

作者头像
Tyan
发布2017-12-28 16:20:14
1.3K0
发布2017-12-28 16:20:14
举报
文章被收录于专栏:SnailTyanSnailTyan

1. 扩张卷积

Dilated Convolutions,翻译为扩张卷积或空洞卷积。扩张卷积与普通的卷积相比,除了卷积核的大小以外,还有一个扩张率(dilation rate)参数,主要用来表示扩张的大小。扩张卷积与普通卷积的相同点在于,卷积核的大小是一样的,在神经网络中即参数数量不变,区别在于扩张卷积具有更大的感受野。感受野是卷积核在图像上看到的大小,例如3×33 \times 3卷积核的感受野大小为9。

2. 示意图

下图是扩张卷积的示意图。

Dilated Convolution
Dilated Convolution

(a) 普通卷积,1-dilated convolution,卷积核的感受野为3×3=93 \times 3 = 9。 (b) 扩张卷积,2-dilated convolution,卷积核的感受野为7×7=497 \times 7 = 49。 (c) 扩张卷积,4-dilated convolution,卷积核的感受野为15×15=22515 \times 15 = 225。

从上图中可以看出,卷积核的参数个数保持不变,感受野的大小随着“dilation rate”参数的增加呈指数增长。

3. 优点

扩展卷积在保持参数个数不变的情况下增大了卷积核的感受野,同时它可以保证输出的特征映射(feature map)的大小保持不变。一个扩张率为2的3×3卷积核,感受野与5×5的卷积核相同,但参数数量仅为9个,是5×5卷积参数数量的36%36\%。

4. 应用

扩张卷积在图像分割、语音合成、机器翻译、目标检测中都有应用。

5. 参考资料

Multi-Scale Context Aggregation by Dilated Convolutions

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017-12-07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 扩张卷积
  • 2. 示意图
  • 3. 优点
  • 4. 应用
  • 5. 参考资料
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档