论文地址: http://arxiv.org/pdf/2010.11820v1.pdf
代码: 公众号回复:2010.11820
来源: 乔治亚理工学院
论文名称:Posterior Re-calibration for Imbalanced Datasets
原文作者:Junjiao Tian
内容提要
当训练标签分布严重不平衡以及测试数据与训练分布不一致时,神经网络的性能较差。为了解决由测试标签分布的不平衡引起的偏移问题,我们从最优贝叶斯分类器的角度出发,推导出一种训练后再平衡的技术,该技术可以通过基于KL-divergence的优化来解决。该方法允许灵活的训练后超参数在验证集上有效地调整,并有效地修改分类器边缘来处理这种不平衡。我们进一步将该方法与已有的似然偏移方法相结合,从贝叶斯的角度对其进行重新解释,证明我们的方法可以统一处理这两个问题。本文方法可以方便地用于底层架构不可知的概率分类问题。我们在六个不同的数据集和五个不同的架构上进行了实验,包括大规模的不平衡数据集,例如用于分类的iNaturalist和用于语义分割的Synthia,结果证明了本文方法的先进性和准确性。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。