YOLACT是首个实时实例分割算法,但是准确率较SOTA差得有点多,YOLACT++从主干网络、分支和anchor的3个角度出发对YOLACT进行优化,在保持实时性的前提下提升了5map,论文改进的角度值得参考
来源:晓飞的算法工程笔记 公众号
论文: YOLACT++ Better Real-time Instance Segmentation
此前的YOLACT尽管能实时推理,但其精度相对于SOTA还是有一些差距,因此,论文提出YOLACT++,在保持实时性的同时大幅增加性能。论文的主要贡献如下:
YOLACT的主要想法是直接在one-stage目标检测算法中加入Mask分支,而不添加任何的RoI池化的操作,将实例分割分成两个并行的分支:
最后取目标检测分支经过NMS后的实例,逐个将原型mask和mask因子向量相乘,再将相乘后的结果合并输出,具体细节可以看公众号之前发的YOLACT文章。
参考Mask Scoring R-CNN,为了缩小分类预测和mask质量间的差距,加入re-scoring分支预测mask与GT间的IoU。以YOLACT截取的mask预测结果(二值化前)为输入,使用6层带ReLU激活的卷积层提取特征,最后进行全局池化输出预测的IoU,将预测的IoU和分类分数相乘作为最终的分数。与Mask Scoring R-CNN的不同点在于:
可变形卷积由于其卷积的可变形性,对目标定位相关的任务均有提升,因此,YOLACT++将主干网络$C_3$到$C_5$的$3\times 3$卷积替换成$3\times 3$的可变形卷积,由于可调制变形卷积开销较大,这里只使用DCNv1,全替换能带来1.8的mask mAP提升,主要原因如下:
由于ResNet-101有30个$3\times 3$卷积层,为了达到性能和准确率之间的trade-off,有以下几种实施的方案:
DCN (interval=3)的效果最好,耗时增加2.8ms,mAP提升1.6。
YOLACT是anchor-based检测算法,选择合适的anchor十分重要,论文尝试了两种选择:
YOLACT是首个实时实例分割算法,但是准确率较SOTA差得有点多,YOLACT++从主干网络、分支和anchor的3个角度出发对YOLACT进行优化,在保持实时性的前提下提升了5map,论文改进的角度值得参考。
如果本文对你有帮助,麻烦点个赞或在看呗~undefined更多内容请关注 微信公众号【晓飞的算法工程笔记】
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。