专栏首页机器学习、深度学习语义分割--DeconvNet--Learning Deconvolution Network for Semantic Segmentation

语义分割--DeconvNet--Learning Deconvolution Network for Semantic Segmentation

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhangjunhit/article/details/72528610

Learning Deconvolution Network for Semantic Segmentation ICCV2015 http://cvlab.postech.ac.kr/research/deconvnet/ https://devhub.io/zh/repos/myungsub-DeconvNet

本文提出了一个 deconvolution network 用于语义分割,还是针对 FCN 改善的。在pooling operation 记录 the locations of maximum activations ,将这些位置用于 unpooling 这一点和 SegNet 是一样的。

首先来说说FCN 有什么问题?

FCN 的 limitations: 1)FCN 因为其固定尺寸receptive field只能解决单尺度的semantics ,对于过大过小的目标分割都有可能有问题 the network can handle only a single scale semantics within image due to the fixed-size receptive field. Therefore, the object that is substantially larger or smaller than the receptive field may be fragmented or mislabeled. 2)FCN 的 deconvolution procedure 太粗糙太简单,FCN 的 deconvolution procedure输入尺寸只有16 × 16,将这个尺寸通过 bilinear interpolation 放大到输入图像尺寸。目标很多细节信息丢失

3 System Architecture

我们的网络包括两个部分:convolution and deconvolution networks

卷积网络用于提取特征,使用 VGG 16-layer net convolution network corresponds to feature extractor

反卷积网络根据特征产生分割结果 deconvolution network is a shape generator that produces object segmentation from the feature extracted from the convolution network.

3.2. Deconvolution Network for Segmentation 反卷积网络中主要有两个操作步骤: unpooling and deconvolution

3.2.1 Unpooling Pooling 会产生降采样的效果,导致一些细节丢失。 spatial information within a receptive field is lost during pooling,这些信息对于语义分割很重要。为了解决这个问题,我们在反卷积网络中使用 unpooling layers, It records the locations of maximum activations selected during pooling operation in switch variables, which are employed to place each activation back to its original pooled location.

3.2.2 Deconvolution unpooling layers 得到一个放大的但是稀疏的响应特征图, 这里通过deconvolution layers 来将稀疏的特征变为稠密的特征 The deconvolution layers densify the sparse activations obtained by unpooling through convolution-like operations with multiple learned filters.

The learned filters in deconvolutional layers correspond to bases to reconstruct shape of an input object.

Unpooling captures example-specific structures learned filters in deconvolutional layers tend to capture class-specific shapes

与FCN 效果对比:

PASCAL VOC 2012 test set

instance-wise prediction 的好处

本文算法较FCN的细节要好些

FCN 的全局观要好一些

与FCN的结合

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 目标检测--Beyond Skip Connections: Top-Down Modulation for Object Detection

    Beyond Skip Connections: Top-Down Modulation for Object Detection CVPR2017 und...

    用户1148525
  • 车道检测--VPGNet: Vanishing Point Guided Network for Lane and Road Marking

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    用户1148525
  • 人脸对齐--Face Alignment In-the-Wild: A Survey

    Face Alignment In-the-Wild: A Survey Computer Vision and Image Understanding ...

    用户1148525
  • FFmpeg 播放器实现音视频同步的三种方式

    前文中,我们基于 FFmpeg 利用 OpenGL ES 和 OpenSL ES 分别实现了对解码后视频和音频的渲染,本文将实现播放器的最后一个重要功能:音视频...

    字节流动
  • Red Hat安全公告—2016年7月

    在2016年6月份至2016年7月份 Red hat CVE漏洞库发布了7个“重要”等级的安全漏洞,针对出现的安全漏洞,发布了对应的Bugzilla。安全公告每...

    嘉为科技
  • 聊聊dubbo-go的forkingCluster

    dubbo-go-v1.4.2/cluster/cluster_impl/forking_cluster.go

    codecraft
  • 聊聊dubbo-go的forkingCluster

    dubbo-go-v1.4.2/cluster/cluster_impl/forking_cluster.go

    codecraft
  • Red Hat安全公告—2017年1月

    在2016年12月份至2017年1月份Red hat CVE漏洞库发布了4个“重要”“严重”等级的安全漏洞,针对出现的安全漏洞,发布了对应的Bugzilla。安...

    嘉为科技
  • 记一次线上DPDK-LVS的故障排查

    http://doc.dpdk.org/guides/prog_guide/mbuf_lib.html

    迅达集团
  • 你不知道的 Gradle 高级技巧(一)

    前段时间研究 Android 端的自动打包,采用的是 Jenkins + Git 的方式,这样,当你 push 完代码之后,Jenkins 会自动拉取你的代码,...

    Vance大飞

扫码关注云+社区

领取腾讯云代金券