点击上方↑↑↑“OpenCV学堂”关注我
欢迎留言,参与互动讨论,发表自己的看法 作者博客: https://blog.csdn.net/linolzhang
今年的Oral,在coco数据集表现超过了Mask RCNN,来自地平线的华科实习生。
提出背景
Mask RCNN 提出以来,一直是作为经典霸屏,但这里面一直存在一个严重的问题,那就是其score机制:由于沿用了 Faster RCNN 的 class和box,对应class是类别score,并不能代表mask的好坏,看下图:
算法框架
问题提出来,很简单的想法就是,我能否加一个分支预测mask部分的score呢?比如用IoU来度量。
思路很简单,在Mask head的基础上,加了一个分支,将ROI对齐后的特征与得到的Mask做了一个concat,然后通过卷积层+全连接层,得到IoU Score,最后通过score相乘得到最终的得分:
Smask = Scls ∗ Siou
来看网络是如何训练的?给几个key point:
这里作者试验了多个head,根据试验效果最后选择当前head,这里也有改进的空间,大家可以好好分析一下。推理阶段
测试效果
测试效果很不错,请看下图:
在COCO 2017数据集上的表现(不同backbone上均有显著提升):
论文:Mask Scoring R-CNN
Paper URL: https://arxiv.org/abs/1903.00241
github URL: https://github.com/zjhuang22/maskscoring_rcnn