前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >场景解析--Pyramid Scene Parsing Network

场景解析--Pyramid Scene Parsing Network

作者头像
用户1148525
发布2019-05-26 12:07:11
9330
发布2019-05-26 12:07:11
举报
文章被收录于专栏:机器学习、深度学习

Pyramid Scene Parsing Network CVPR2017 语义分割 https://github.com/hszhao/PSPNet

针对 FCN 中没有 context 信息,本文提出的 PSPNet 网络嵌入了比 global average pooling更好的 global context 信息来提升分割效果

2 Related Work

对于 scene parsing 和 semantic segmentation 任务, 深度卷积网络是目前的主流方法。这里我们的基准网络是 FCN+dilated network。

目前大家的研究方向主要有两个:1)组合利用多尺度特征,2)使用 CRF作为分割后续处理方法。 对于global context 信息,文献【24】使用 global average pooling,但是对于复杂的 ADE20K 数据库,效果不是很好。这里我们使用了另一个 global context 信息

3 Pyramid Scene Parsing Network 3.1. Important Observations 针对 ADE20K 数据库,我们观察到了一些现象: 1)Mismatched Relationship 目标之间应该有一定的相关性 2)Confusion Categories 图像中同一个物体同时被标记为两个类别 field and earth; mountain and hill,wall, house, building and skyscraper 3)Inconspicuous Classes 大目标 小目标问题 综上所述,主要问题在于 contextual relationship and global information for different receptive fields

这里写图片描述
这里写图片描述

3.2. Pyramid Pooling Module

在一个深度网络中,感受野的尺寸大小决定了我们有多少 context 信息可以用。理论上 ResNet 的感受野尺寸要比输入图像尺寸大。但是文献【42】指出CNN 的实际感受野尺寸要比理论尺寸小很多。文献【24】提出的 Global average pooling 对于复杂的 ADE20K 数据库来说过于简单了。这里我们借鉴 文献【12】Spatial pyramid pooling 提出了 pyramid pooling module 来得到全局先验信息。

这里写图片描述
这里写图片描述

上图中间模块 pyramid pooling module 第一行 是用 global pooling 生成的 a single bin output 第二行我们将特征图等分为4块,每块分别用global pooling得到 bin output。上图四行分别对应 1×1, 2×2, 3×3 and 6×6

为了维持 global feature 的权值,在每一行我们使用 一个 1×1 convolution layer 来降低 context representation 的维度。接着我们使用 bilinear interpolation 插值,使其和原始特征图尺寸一样大小。最后和原始特征图组合起来。

4 Deep Supervision for ResNet-Based FCN 为了更好的训练网络层数较多的模型,我们引入了 additional loss,another classifier is applied after the fourth stage

The auxiliary loss helps optimize the learning process, while the master branch loss takes the most responsibility. We add weight to balance the auxiliary loss.

Deep Supervision 在人脸识别算法 DeepID2 中已经存在。

5 Experiments

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年05月15日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档