首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR2020 | RPM-Net | 像素级目标分割网络结构,无需人工标注数据,通过自监督训练,接近全监督算法。

CVPR2020 | RPM-Net | 像素级目标分割网络结构,无需人工标注数据,通过自监督训练,接近全监督算法。

作者头像
CNNer
发布2020-06-19 15:39:11
8600
发布2020-06-19 15:39:11
举报
文章被收录于专栏:CNNerCNNer

论文地址:https://arxiv.org/abs/1909.13247 来源:韩国技术学院 论文名称:RPM-Net: Robust Pixel-Level Matching Networks for Self-SupervisedVideo Object Segmentation 原文作者:Youngeun Kim

本文提出了一种可以不需要人工标注数据集的自监督视频目标跟踪算法。明确的说,本文提出了一种鲁棒的像素级的匹配网络(RPM-Net),该深度学习框架通过颜色信息对相邻帧的图像信息进行像素级别的匹配,并且该算法在训练过程不需要人工标注的数据集。实际上RPM-Net可以被分为两个主要的模块。首先,嵌入模块,将输入的图像数据映射到高维的嵌入空间中。然后,匹配模块使用可变卷积层对提取的嵌入特征进行操作,实现当前帧和目标帧之间的像素匹配。与以往使用可变形卷积的方法不同,该匹配模块采用可变形卷积来在时间和空间对相邻像素中的相似特征进行匹配。实验表明,本文算法提取的特征提高了对摄像机抖动、快速运动、变形和遮挡等视频目标分割问题的鲁棒性。同时在三个公开的数据集( DAVIS-2017、SegTrack-v2 andYoutube-Objects)上进行了综合测试,算法在自监督视频目标分割领域表现SOTA。并且该算法显著的减小了自监督和全监督视频目标分割算法之间的差距(在DAVIS-2017的验证集上分别为41.0%和52.5%)。

下面是论文具体框架结构以及实验结果:

声明:文章来自于原作者公开发表的论文,仅用于学习分享,版权归原作者所有,侵权请联系删除

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CNNer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档