前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR 2019 | 惊艳的SiamMask:开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask:开源快速同时进行目标跟踪与分割算法

作者头像
CV君
发布2019-12-27 11:10:35
9940
发布2019-12-27 11:10:35
举报

上面这张Gif图演示了SiamMask的效果,只需要鼠标滑动选择目标的包围框,即可同时实现目标跟踪与分割。

这种视频里目标的像素级标注,很有用,比如给视频叠加特效可以不覆盖目标人物,或者视频编辑中扣掉特定目标。想想前段时间浙江卫视和北京卫视如果有了这套软件,让某吴姓演员从节目中消失就简单多了,是不是?

近日,CVPR 2019接收的论文《Fast Online Object Tracking and Segmentation: A Unifying Approach》作者Qiang Wang开源了这套SiamMask代码,引起了极大关注。我们一起来看看吧。

论文作者信息:

论文作者团队来自中科院自动化所、牛津大学、Five AI公司。

感谢~

研究目的

以往大多数目标跟踪得到的结果是目标的包围框,而作者希望将跟踪与分割结合起来,算法“实时”给出目标的像素级标注。

上图中,左侧是初始化的操作,在视频第一帧给出目标的包围框,右侧的多张图像为普通的跟踪算法计算得到估计的包围框和SiamMask估计的目标的分割mask。

算法原理

作者是在近年出现的SiamFC跟踪算法基础上做的改进。

下图展示了其整体算法流程。

左侧上面图像为框出来的目标图像,左侧下面图像为要搜索目标位置的视频中的一帧,经过卷积网络,生成Row(response of a candidate window,候选窗口响应),网络后面有三个head,除了在SiamFC算法中已经存在的预测box(目标位置)的head和预测响应score(目标出现概率)的head,作者增加了预测目标mask(目标二值掩码)的head。

另外也可以直接去掉预测box的head,提高计算速度,包围框也可以通过mask计算得到。网络结构如下:

下图展示了使用SiamMask算法计算得到的图像中不同位置的score值。

实验结果

作者在VOT-2016、VOT-2018数据集上测试跟踪精度,在DAVIS-2016、DAVIS-2017数据集上测试了目标分割的精度。

下图是与普通的跟踪算法的结果比较。

SiamMask相比之前的跟踪算法的state-of-the-art精度又改进不少。

下图是与现有的视频目标分割算法的精度的比较。

虽然SiamMask精度并不是最高的,但速度却比其他算法快1到2个数量级!在真实应用中更有价值。

下图为mIoU-速度的散点图。

一些视频目标分割示例(请点击查看大图):

其实作者公布了目标分割效果视频,更加惊艳,可惜腾讯的视频审核机制有问题竟然没给通过。微信下方扫码即可查看。

重点来了!

代码地址:

https://github.com/foolwood/SiamMask

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-03-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我爱计算机视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
视频审核
视频审核(Media Auditing Service,MAS)是数据万象产品下的子服务,能够对云存储中的视频进行有效识别,识别出可能令人反感、不安全或不适宜内容的视频并处置,协助用户建设绿色健康的社交网络环境。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档