前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >语义分割

语义分割

作者头像
用户1148525
发布2019-05-26 11:52:51
4850
发布2019-05-26 11:52:51
举报

Learning Object Interactions and Descriptions for Semantic Image Segmentation CVPR2017

本文主要是从训练数据的角度来提升CNN分割性能的。由于像素级别标记的样本很少,制作样本成本高。这里直接根据关键词从网络上搜索相关图像,建立了一个数据库 IDW, 结合 VOC12上面的训练数据联合训练,对此设计了一个 IDW-CNN 模型,经过联合训练得到的模型用于分割,性能提升比较大。

首先来看看这个IDW数据库的建立 IDW 和 VOC12 两个样本的对比

这里写图片描述
这里写图片描述

看看大家都是怎么使用额外的信息

这里写图片描述
这里写图片描述
  1. Learning Image Descriptions We construct an image description in the wild (IDW) dataset to improve the segmentation accuracy in VOC12 这里我们建立一个IDW数据库的图像描述用于提升 VOC12分割性能 In the first stage 根据 VOC12 里的20个类别,选择 21 prepositions and verbs 进行组合,得到 subject + verb/prep. + object’ leads to 20×21×20 = 8400 然后对其进行过滤,得到 hundreds of meaningful phrases,用这些语言描述去搜索图像,根据图像数量再过滤一下,把太少的过滤掉。最终得到 59 valid phrases IDW has 41,421 images and descriptions
这里写图片描述
这里写图片描述

Image Description Representation 根据图像在网络上语言描述信息提取用于分割的关键信息

这里写图片描述
这里写图片描述

IDW-CNN 网络结构示意图

这里写图片描述
这里写图片描述

IDW-CNN 首先使用 ResNet-101 提取特征,然后有两个 streams: 第一个 stream 用于预测初步分割结果,第二个 stream 用于估计 物体之间的相关性 object interactions。这里面有 21 object nets 和 22 action nets 每个 subnet 结构如上图 (b)所示

两个类别物体特征可以直接相加

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

训练过程也是逐步进行的。

最后的分割结果:

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年07月05日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档