PSPNet – Pyramid Scene Parsing Network 核心模块是金字塔池化模块( pyramid pooling module),它能够聚合不同区域的上下文信息,从而提高获取全局信息的能力...论文中使用的4个等级,核大小分别为1×1,2×2,3×3,6×6 2.整体架构 在PSP模块的基础上,PSPNet的整体架构如下: CNN是经过预训练的模型(ResNet101)和空洞卷积策略
本次, 由香港中文大学(CUHK)和商汤科技(SenseTime)提出的金字塔场景解析网络(Pyramid Scene Parsing Network, PSPNet)已经过审阅。...场景解析 通过使用金字塔池化模块(Pyramid Pooling Module),在整合基于不同区域的上下文后,PSPNet在效果上超过了FCN、DeepLab和DilatedNet等时下最佳的方法。...ADE2K - ImageNet场景解析挑战赛2016 ADE2K测试集结果 PSPNet赢得了2016年ImageNet场景解析挑战赛冠军。 5.2....同样,PSPNet优于所有最先进的方法,如FCN、DeconvNet、DeepLab和Dilation8。 下面是一些例子: PASCAL VOC 2012样例 5.3....Cityscapes测试集结果 采用精细标注数据训练,或采用精细数据与粗略标注数据同时训练,PSPNet都取得了较好的效果。
通过使用金字塔池化模块(Pyramid Pooling Module),在整合基于不同区域的上下文后,PSPNet在效果上超过了FCN、DeepLab和DilatedNet等时下最佳的方法。...原标题 | Review: PSPNet — Winner in ILSVRC 2016 (Semantic Segmentation / Scene Parsing) 作者 | Sik-Ho Tsang...对全局信息的需要 (c) 原有的未经上下文整合的FCN,(d) 经上下文整合的PSPNet 关系错误匹配:FCN基于外观将黄色框内的船预测为“汽车”。...ADE2K - ImageNet场景解析挑战赛2016 ADE2K测试集结果 PSPNet赢得了2016年ImageNet场景解析挑战赛冠军。 5.2....Cityscapes测试集结果 采用精细标注数据训练,或采用精细数据与粗略标注数据同时训练,PSPNet都取得了较好的效果。
从左到右分别为:图像、真值、FCN结果和PSPNet结果。 除此之外,由于金字塔结构并行考虑了多个感受野下的目标特征,从而对于尺寸较大或尺寸过小的目标有更好的识别效果。 ?...从左到右分别为:图像、真值、FCN结果和PSPNet结果。 可见,同时考虑不同感受野下的上下文信息是十分必要的。下面我们就一起来具体看一下金字塔池化模型。...3 实验结果 为了验证金字塔结构的有效性,PSPNet的作者对其进行了一系列的剥离实验。具体结果如下表所示: ? ADE20K数据库下的分割结果: ?...总结 本文我们了解了上下文信息整合的多尺度估计网络PSPNet和其中的金字塔池化模型。除了同种特征的堆叠,我们还可以利用多特征融合提升分割的效果。下期我们就一起来看一下ParseNet。
下面我们对主流的模型进行介绍,包括FCN、SegNet、U-Net、PSPNet、DeepLab V1~V3等。...5.8 PSPNet PSPNet在论文 PSPNet: Pyramid Scene Parsing Network 中提出。...PSPNet利用基于不同区域的上下文信息集合,通过我们的金字塔池化模块,使用提出的金字塔场景解析网络(PSPNet)来发挥全局上下文信息的能力。...全局先验表征在场景解析任务中产生了良好的质量结果,而 PSPNet 为像素级的预测提供了一个更好的框架,该方法在不同的数据集上达到了最优性能。...RefineNet 解决了传统卷积网络中空间分辨率减少的问题,与 PSPNet(使用计算成本高的空洞卷积)使用的方法非常不同。
主要尝试的模型: 训练数据集s1s2 (pspnet-densenet-s1s2) 训练数据集s1s2-crf2 (pspnet-densenet-s1s2-crf2) 不同网络输入尺度 (pspnet-densenet-s1s2...-320) focal loss (pspnet-densenet-s1s2-crf2-fl) 类别加权训练 (pspnet-densenet-s1s2-crf2-weight) ?...-320,更改--image_rows 和 --img_cols 为320 在run_train.sh,除了pspnet-densenet-s1s2-crf2-fl调用 train-fl.py, 其它模型用...train.py 对于pspnet-densenet-s1s2-crf2-weight,更改train.py中的weights_per_class 为[0,1,1,3,3],默认[0,1,1,1,1].../submit.sh results/pspnet-densenet-s1s2-crf2/vote 1)
目前已经实现了包括PSPNet和PSANet在内的网络,其在2016年ImageNet场景解析挑战赛@ ECCV16,LSUN语义分割挑战赛2017 @ CVPR17和WAD可驾驶区域分割挑战赛2018...该库开发者即PSPNet和PSANet算法的一作。 亮点 1. 同时支持多线程训练与多进程训练,并且后者非常快(该库比较重视训练)。 2....作者推荐的软硬件环境: (要4到8块显卡,看来没有多卡,语义分割是玩不起了~) 训练简单 该库的训练非常简单,简单配置后只需要一条命令 sh tool/train.sh ade20k pspnet50...测试简单 简单配置数据集和模型路径后,也只需要一条命令: sh tool/test.sh ade20k pspnet50 在单幅图像上测试也很简单,示例: PYTHONPATH=..../ python tool/demo.py --config=config/ade20k/ade20k_pspnet50.yaml --image=figure/demo/ADE_val_00001515
ICNet是一个基于PSPNet的实时语义分割网络,设计目的是减少PSPNet推断时期的耗时,论文对PSPNet做了深入分析,在PSPNet的基础上引入级联特征融合模块,实现快速且高质量的分割模型。...关于PSPNet请看昨天的推文。 可以看到之前的许多分割的经典方法速度不快,而速度快的ENet的精度又不高,PSPNet在速度和精度找到了一个平衡点。...PSPNet给出了一个快速的语义分割的层次结构,利用级联图像作为输入加速推理,构建一个实时分割系统。 网络耗时分析 蓝色的分辨率为1024*2048,绿色的分辨率为512*512。...这里以1:8,1:16,1:32的比例测试PSPNet50,结果如下: 较小的特征图可以以牺牲准确度换取更快的推断,但就算使用1:32(132ms)依然达不到实时要求。...注意到全部分支的速度很快,并且性能接近PSPNet了,且能保持30fps。而且内存消耗也明显减少了。 结论 论文在PSPNet的基础上改进出一个ICNet。
Neural Architecture Search 语义分割 DeepLabV3: Rethinking Atrous Convolution for Semantic Image Segmentation PSPNet...datasets/seg/preprocess TorchCV 的命令 项目作者提供了命令行工具,供用户使用模型,代码如下: 训练 cd scripts/seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh...train tag 恢复训练 cd scripts/seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh train tag 验证 cd scripts.../seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh val tag 测试 cd scripts/seg/cityscapes/ bash run_fs_pspnet_cityscapes_seg.sh
模型平台获取实现资源:https://sota.jiqizhixin.com/project/refinenet 4、 PSPNet PSPNet全称为Pyramid Scene Parseing...PSPNet通过对不同区域的上下文信息进行聚合,提升了网络利用全局上下文信息的能力。PSPNet使用的策略是:pooling-conv-upsample,拼接得到特征图后进行标签预测。...PSPNet的完整架构如图6所示。 图6 PSPNet概述。...PSPNet为四级模块,其二进制大小分别为1×1、2×2、3×3和6×6。...平台收录PSPNet共5个模型实现。 项目 SOTA!平台项目详情页 PSPNet 前往 SOTA!
9.8 PSPNet 场景解析对于无限制的开放词汇和不同场景来说是具有挑战性的。...本文使用文中的 pyramid pooling module 实现基于不同区域的上下文集成,提出了PSPNet,实现利用上下文信息的能力来进行场景解析。...作者认为,FCN存在的主要问题是没有采取合适的策略来用全局的信息,本文的做法就是借鉴SPPNet来设计了PSPNet解决这个问题。...本文的主要贡献如下: (1)提出了PSPNet在基于FCN的框架中集成困难的上下文特征。 (2)通过基于深度监督误差开发了针对ResNet的高效优化策略。...Encoder-Decoder:利用Decoder 阶段的多尺度特征,运用到Decoder阶段上恢复空间分辨率,代表工作有 FCN、SegNet、PSPNet等工作。
深度学习系列(五)分割网络模型(DeepLab V1、DeepLab V2、PSPNet、DeepLab V3、DeepLab V3+) 内容目录 1、Deeplab V12、DeepLab V23、PSPNet4...3、PSPNet 《Pyramid Scene Parsing Network》 https://arxiv.org/pdf/1612.01105.pdf 通过多尺度 Pooling 的方式得到不同 Scale...PSPNet在不同网格尺度上执行空间池化,并在多个语义分割数据集上获得出色的性能。 ? ?...多个分割网络的pytorch实现,如:Deeplabv3, Deeplabv3_plus, PSPNet, UNet, UNet_AutoEncoder, UNet_nested, R2AttUNet,
一些最新的方法如PSPNet,RefineNet,DeepLab和AcNet等以非常高的准确率执行语义分割任务。...此外,有更多有效的语义分割网络被提出,我们的工作基于ERF-PSPNet,这是一种为导航辅助系统设计的最新语义分割网络。...最后,我们用调整后的具有一定百分比的夜间图像的训练数据训练ERF-PSPNet,达到提高夜间语义分割模型性能的目的。...对于ERF-PSPNet,编码器部分在ImageNet上进行了预训练,所以ERF-PSPNet所有的训练任务都在解码器部分的训练中。第一种方法是在BDD10K上训练ERF-PSPNet。...在第二种方法中,使用BDD10K训练集中不同比例的图像来训练ERF-PSPNet。
由上图可以看出,比较出名的分割模型PSPNet和ResNet38模型,分割准确率高,但是效率不高,像实时性比较好的ENet分割效率高但是分割准确度还没有60%。...channels数目和图片尺寸对模型速度的影响 分析下面这张图,不同的分辨率图片输入PSPNet50网络,观察每一个阶段的计算时间,由此,我们可以看出,模型中每层的复杂度同输入图像的分辨率和模型的channel...ICNet模型 根据上面分析的影响模型复杂度的因素,我们设计了基于PSPNet模型的多分辨率输入ICNet模型,将图片按一定比例缩放为不同的尺寸,将最小尺度的图片输入复杂度最高的分割模型,将高分辨率图片输入低复杂度模型...模型特点 (1)channels数目和输入特征的尺度影响卷积层的复杂度 (2)模型存在三个分支,对应不同复杂度的模型以及不同尺度的输入图片 (3)一个完整的PSPNet模型,和两个分支优化分割结果 (4...下采样图片输入尺寸,送入PSPNet50模型,直接上采样至原始尺寸,结果粗糙,遗失了一些很小但是重要的细节。图中scale为图片下采样比例,可以看出,输入尺寸越小,模型准确度越低,但运行速度越快。
当下载结束,您将看到以下两个文件在您当前工作目录:pspnet_r50-d8_4xb2-40k_cityscapes-512x1024.py 和 pspnet_r50-d8_512x1024_40k_cityscapes...源码安装检验方式 cd mmsegmentation python demo/image_demo.py demo/demo.png \\ configs/pspnet/pspnet_r50-d8_4xb2...-40k_cityscapes-512x1024.py \\ pspnet_r50-d8_512x1024_40k_cityscapes_20200605_003338-2966598c.pth \\.../pspnet_r50-d8_4xb2-40k_cityscapes-512x1024.py : _base_ = [ '...../_base_/models/pspnet_r50-d8.py', '../_base_/datasets/cityscapes.py', '..
# Pyramid Scene Parsing Network [Project] [Code-Caffe] [Paper] [Slides] PSPNet 特点: * 场景标注 Scene...PSPNet: - PSPNet 来提取合适的全部特征 - 将传统 dilated FCN 产生的像素级特征,扩展到 global pyramid pooling 特征....网络结构 pyramid scene parsing network (PSPNet) 网络结构如 Figure3....PSPNet 特点: - 能够有效的得到像素级场景标注的全局上下文信息, pyramid pooling module 集合不同 levels 的信息,比 global pooling 具有更好的特征表示能力了
如下例子是使用 PSPNet 训练并采用 OHEM 策略的配置: _base_ = '..../pspnet_r50-d8_512x1024_40k_cityscapes.py' model=dict( decode_head=dict( sampler=dict(type.../pspnet_r50-d8_512x1024_40k_cityscapes.py' model=dict( decode_head=dict( loss_decode=dict
From Github Issues of PSPNet PSPNet author’s answer for the training, the issues are mainly related...to do automatic calculation. other’s discussion [From Fromandto]: I am training a 713 resolution pspnet...However, the bn layer seems important to the performance of PSPNet.
从无到有) SegNet Vijay Badrinarayanan DeconvNet 2016 每个max_pooling的max索引 所有fc层 DeepLab FCN PSPNet...Mask-RCNN 2017 真正做到像素级 Image Segmentation(图像分割)族谱 FCN DeepLab DeconvNet SegNet PSPNet
领取专属 10元无门槛券
手把手带您无忧上云