专栏首页机器学习、深度学习语义分割--Global Deconvolutional Networks for Semantic Segmentation

语义分割--Global Deconvolutional Networks for Semantic Segmentation

语义分割 Global Deconvolutional Networks for Semantic Segmentation BMVC 2016 https://github.com/DrSleep/GDN

基于CNN的语义分割在近两年得到飞速的发展,但是这种 pixel-wise labelling with CNNs has its own unique challenges: 特征图的精确放大 + context 信息的嵌入 1)an accurate deconvolution, or upsampling, of low-resolution output into a higher-resolution segmentation mask 2)an inclusion of global information, or context, within locally extracted features

本文提出一个网络结构 Global Deconvolutional Network 解决这两个问题。本文的模型最大亮点是在保持较高精度同时 significantly 降低了模型的参数量

3 Global Deconvolutional Network 3.1 Baseline Models 这里我们选择了两个开源的基准分割模型: FCN-32s and DeepLab ,他们两个都是基于 VGG 16-layer net,将全连接层变为卷积层,目标函数用 pixel-wise softmax loss 表示

3.2 Global Interpolation 输入图像经过一系列卷积和池化后得到一个 encoded image,其尺寸降采样很多。为了输出原始图像尺寸的分割图像,我们需要同时对这个 encoded image 进行 decode and upsample。 这里我们设计了一个 a learnable global interpolation

假定 x 表示 decoded information, 输入RGB图像为 I , 上采样后的信号为 y

我们的这个上采样不是根据最近的四个点数据信息来计算的,而是包括了更多的信息进来 Opposite to a simple bilinear interpolation, which operates only on the closest four points, the equation above allows to include much more information on the rectangular grid

this operation is differentiable

3.3 Multi-task loss loss functions 定义如下:

本文提出的每个模型其目的都是为了提取全局信息,将其嵌入到网络中去。本文提出的这个插值方法也是有效的上采样方法。 Overall, each component of the proposed approach aims to capture global information and incorporate it into the network, hence the name global deconvolutional network. Besides that, the proposed interpolation also effectively upsamples the coarse output and a nonlinear upsampling can be achieved with the addition of an activation function on the top of the block.

4 Experiments

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 二值网络训练--A Empirical Study of Binary Neural Networks' Optimisation

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    用户1148525
  • 多人部件解析

    Towards Real World Human Parsing: Multiple-Human Parsing in the Wild https://a...

    用户1148525
  • 视频物体分割--One-Shot Video Object Segmentation

    One-Shot Video Object Segmentation CVPR2017 http://www.vision.ee.ethz.ch/~cvl...

    用户1148525
  • SAP S/4 HANA新变化-FI:GL总账

    GENERAL LEDGER总账 General Ledger in S/4H is based in the Universal Journal; the l...

    SAP最佳业务实践
  • 使用深度强化学习测试三消游戏(CS AI)

    测试视频游戏是制作过程中的关键步骤,需要花费大量时间和资源。一些软件公司正试图使用​​人工智能来替代能够使用人工代理的系统来减少对人力资源的需求。我们研究了使用...

    刘子蔚
  • 【NDN心得】Literature Review on Security of Named Data Networking

    版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/gongxifacai_believe/artic...

    魏晓蕾
  • SAP UI5库文件的加载细节探讨

    In every UI5 application we declare usage on libraries like sap.ui.commons via “...

    Jerry Wang
  • PAT 1011 World Cup Betting (20分) 比较大小难度级别

    With the 2010 FIFA World Cup running, football fans the world over were becoming...

    vivi
  • 陷入回声室:Twitter上的意大利疫苗辩论(CS AI)

    出现在美国和欧洲的麻疹是在2000年代初被消灭的一种疾病,与此同时,在社交媒体上关于接种疫苗的优点的辩论也越来越多。在这项研究中,我们调查发现Twitter上的...

    用户7035935
  • 基于注意力的基于神经网络的远程监督情感态度提取(CS CL)

    在情感态度提取任务中,目标是识别文本中实体之间的情感关系。本文提供了一种在情感态度提取任务中基于注意力的上下文编码器的研究。基于此任务,采用两种类型的注意力上下...

    用户7454091

扫码关注云+社区

领取腾讯云代金券