前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ICML 2019 反锯齿下采样改进网络平移不变性

ICML 2019 反锯齿下采样改进网络平移不变性

作者头像
CV君
发布2019-12-27 17:02:36
1.1K0
发布2019-12-27 17:02:36
举报

前几天看到一篇来自Adobe研究院的论文《Making Convolutional Networks Shift-Invariant Again》,感觉很有启发性。

论文只有一位作者,该论文已被ICML 2019 接收。

在计算机视觉特征提取的研究历史中,平移不变性是算法设计者不断追求的。

具有平移不变性意即目标在图像中平移一定的像素,提取的特征不会差别很大。

请看以下这幅动图:

baseline展示了CNN网络的预测结果随着图像变化而大幅变化,Anti-aliased 为该论文的结果。

在深度卷积网络的世界里,一只鸟的图片平移了几个像素,它是一只鸟的概率就不同了,甚至就不再是一只鸟了,这就说不过去了。

这说明CNN网络不具有良好的平移不变性。

作者考虑了CNN网络的各个结构,认为卷积层本身是具有平移不变性的,而池化层破坏了平移不变性。

作者认为可以借鉴信号处理中反锯齿算法的设计,即在信号下采样之前进行低通滤波(也就是图像模糊),缓解池化操作带来的对平移不变性的破坏。

具体做法请看下图:

baseline展示了原始的MaxPool操作,作者将其看为两步,先Max,再下采样。

作者的做法是在Max之后加一步图像模糊,嗯,就是这么简单~

作者对StridedConv与AveragePool等涉及到下采样的网络操作都进行了改进,成为ConvBlurPool、BlurPool,即都是在下采样之前进行模糊操作。

实验中也研究使用了不同类型和参数的模糊核。

这么简单,会奏效吗?

作者在CIFAR和ImageNet数据集上使用改造后的多个知名网络进行了实验,均获得了精度提升。

作者也将此网络结构用于图像生成,也获得了更好的视觉结果。

作者认为,在解决CNN方法带来的一些问题中,研究人员往往忽略了传统信号处理领域里已经取得的成果。

论文地址:

https://arxiv.org/abs/1904.11486

代码将在以下网址开源:

https://richzhang.github.io/antialiased-cnns/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我爱计算机视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档