论文链接:https://arxiv.org/abs/1902.04103
Code: https://github.com/dmlc/gluon-cv
发表日期:2019.02.13
一个提升目标检测性能的大招!
与针对更好的图像分类模型的巨大研究成果相比,应用于物体探测器训练的努力在普及性和普遍性方面相形见绌。由于网络结构和优化目标变的更加复杂,因此针对某些检测算法而不是其他检测算法专门设计了各种训练策略和管道。在这项工作中,我们探索了有助于将最先进的目标检测模型的性能提升到一个新水平而不牺牲推理速度的通用调整。我们的实验表明,这些调整可以达到绝对精度的5%的提升,每个人都应该考虑在一定程度上应用于物体检测训练。
主要贡献:
1)我们是第一个系统地评估各种训练启发法在不同物体检测管道中应用的方法,为今后的研究提供了有价值的实践指导。
2)我们提出了一种用于训练目标检测网络的视觉连贯图像混合方法,该方法被证明在提高模型泛化能力方面非常有效。
3)在不改变网络结构和损失函数的情况下,基于现有模型,我们在30%的绝对平均精度上实现了高达5%的改进。我们取得的是所有免费午餐,没有额外的推理代价。
4)我们扩展了目标检测数据增强领域的研究深度,显著增强了模型泛化能力,有助于减少过拟合问题。实验还揭示了可以在不同网络结构中一致地提高目标检测性能的良好技术。
论文性能(MS COCO 2017 val set):
领取专属 10元无门槛券
私享最新 技术干货