IJCAI Oral:弱监督实现精确目标检测,上交大提出协同学习框架


新智元专栏

作者:上海交通大学未来媒体网络协同创新中心

【新智元导读】训练一个高准确率的检测模型需要大量精细标注的图片数据,其成本很高。本文提出了一种弱监督协同学习框架,仅使用粗略标签的图片训练目标检测模型,测试结果显示其定位精确率和检测准确率均显著优于目前最先进的方法。

目标检测是机器视觉的基本问题,在视频监控、无人驾驶等场景都有广泛应用。随着深度学习的兴起,近年来涌现了大量优秀的目标检测模型。然而,训练一个高准确率的检测模型需要大量的以包围框形式精细标注的图片数据作为模型监督条件,需要花费大量的人力物力。

同时,我们可以从互联网轻松获取海量粗标注的图片,如利用Flickr的标签。因此,研究如何在弱监督条件下,即仅提供粗略图片类别标注,训练目标检测模型,具有重要的意义。已有学者探索了基于多示例学习构建弱监督条件下的目标检测模型学习方法,但是模型的精确度仍然难以令人满意。

论文:Collaborative Learning for Weakly Supervised Object Detection

论文链接:https://arxiv.org/abs/1802.03531

本论文提出了一种弱监督协同学习(WSCL)的框架,将弱监督学习网络和强监督学习网络连接成为一个整体网络,通过一致性损失约束强监督和弱监督学习网络具有相似的预测结果,通过强监督和弱监督学习网络间部分特征共享保证两个网络在感知水平上的一致性,从而实现强监督和弱监督学习网络的协同增强学习。弱监督协同学习框架结构如下图所示:

弱监督协同学习框架(以目标检测为例)

基于上述弱监督协同学习框架,论文设计了一个端到端的弱监督协同检测网络(WSCDN),弱监督和强监督的检测模块分别采用了目前最优秀WSDDNRCNN网络结构。其网络结构如下图所示。

弱监督协同目标检测学习模型

在每次学习迭代中,整个目标检测网络只将图像级标签作为弱监督,并且通过预测一致性损失并行优化强监督和弱监督检测网络

下图是WSCDN训练时,强监督和弱监督检测网络准确率的变化曲线。

可以看出,在训练的初始阶段,弱监督检测网络准确率高于强监督检测网络。随着协同训练轮次的增多,两者的准确率均逐渐上升,但强监督检测网络提升的速度更快,并很快超越弱监督检测网络。在整个训练过程中,两类检测网络相互协同,达到了共同提高的效果。

我们比较了弱监督协同检测网络与其他相关弱监督检测方法在PASCAL VOC 2007测试图片上的效果(见下图)。其中,IW是单独训练得到的弱监督检测模型,CSS是分开迭代训练得到的强监督检测模型,CLWCLS分别是通过弱监督协同检测网络得到的强监督和弱监督检测网络。可以看出,我们的强监督检测网络明显优于其他检测器网络,表现在可以得到更全面和更紧凑的包围框预测。

我们用PASCAL VOC 2007和PASCAL VOC 2012数据集进行了测试。结果表明,弱监督协同检测网络的定位精确率以及检测准确率均显著优于目前最先进的方法

弱监督协同检测网络与其他目前最先进的方法在PASCAL VOC 2007 测试数据集上检测精确度的比较(AP) (%)

弱监督协同检测网络与其他目前最先进的方法在PASCAL VOC 2007 trainval set 上定位精确度的比较(CorLoc) (%)

弱监督协同检测网络与其他目前最先进的方法在PASCAL VOC 2012 测试数据集上检测精确度的比较(AP) (%)

弱监督协同检测网络与其他目前最先进的方法在PASCAL VOC 2012 trainval set 上定位精确度的比较(CorLoc) (%)

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-05-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏fangyangcoder

Andrew Ng机器学习课程笔记(五)之应用机器学习的建议

http://www.cnblogs.com/fydeblog/p/7368472.html

14010
来自专栏机器学习算法工程师

《机器学习》笔记-半监督学习(13)

如今机器学习和深度学习如此火热,相信很多像我一样的普通程序猿或者还在大学校园中的同学,一定也想参与其中。不管是出于好奇,还是自身充电,跟上潮流,我觉得都值得试一...

28020
来自专栏机器之心

学界 | ConvCRF:一种结合条件随机场与CNN的高效语义分割方法

33250
来自专栏机器之心

学界 | 李飞飞等人提出MentorNet:让深度神经网络克服大数据中的噪声

65040
来自专栏ACM算法日常

第四篇:《机器学习之逻辑回归(上)》

前面我们学习了线性回归,它通过输入一个样本的所有特征,然后和参数计算得到了自己的预测值,再通过梯度下降完成代价函数的最小化。

11550
来自专栏机器之心

学界 | 综述论文:机器学习中的模型评价、模型选择与算法选择

41580
来自专栏新智元

【一图看懂】机器学习6大算法,优势劣势全解析

【新智元导读】我们将机器学习中最突出、最常用的算法分为三类:线性模型、基于树的模型、神经网络,用一张图表简明地指出了每一类的优势和劣势。 在机器学习中,我们的目...

45990
来自专栏机器之心

深度森林第三弹:周志华组提出可做表征学习的多层梯度提升决策树

30940
来自专栏机器之心

入门 | 简述迁移学习在深度学习中的应用

37970
来自专栏null的专栏

图解机器学习总结——1、基本概念

序言:近期主要帮同事讲解《图解机器学习》,刚拿到这本书觉得内容相比较平常使用的机器学习算法,很多地方讲解得比较奇怪,在认真的读完后,觉得还是有很多重要的东西,因...

43780

扫码关注云+社区

领取腾讯云代金券