IJCV：河北农业大学刘博博士提出基于组协作表示的图像集分类方法

文章来源：企鹅号 - HEBAU青年教师学术沙龙

2018年5月23日，国际权威杂志International Journal of Computer Vision（IJCV）在线发表了我校信息科学与技术学院刘博老师题为“GroupCollaborative Representation for Image Set Classification”的研究论文。刘博老师为论文的第一作者。IJCV为计算机视觉领域顶级期刊之一（影响因子11.541，属于一区top期刊）。本研究针对图像集数据的结构特点提出了完整的图像集分类算法框架，并通过理论分析和实验对比验证了该框架的有效性。该研究成果可用于视频人脸识别，多角度物体识别等任务。

随着图像获取和传输技术的发展，大量数据以集合形式存在。图像集分类任务是在给定一定数量的训练集合的前提下，预测每一个测试集合的类标。图像集数据来源多样（图1），如一段人脸视频可以认为是一个图像集，集合由视频中的若干帧组成，此时的图像集分类任务被特化为基于视频的人脸识别问题。不仅如此，只要内在具有某种关联性的数据都可以构成一个集合，如某一物体多角度的图片，或者某一用户的个人相册等。与单幅图像相比，图像集在提供待分类对象丰富信息的同时，还可以简化分类流程，降低标注负担，但复杂的集合内变化也提升了分类难度。图像集分类的主要挑战在于两点，一是如何建模图像集，二是如何度量集合间的相似性。

在本研究中，课题组提出了组协作表示（GCR）框架用于图像集分类（图2）。在该框架中，首先利用子空间聚类算法从训练集合中抽取多个子空间结构，进而获得单幅训练图像到多个训练集合的表示（point-to-sets representation，PSsR）及单个测试集合到多个训练集合的表示（set-to-setsrepresentation, SSsR）。与已有的集合分类方法相比，GCR可以更有效的捕捉集合结构并减少信息损失。特别是PSsR使用所有数据参与训练，可有效处理集合内含有图像不足的情况。而SSsR一方面可以改善对测试集合分类投票的鲁棒性，另一方面可以提升测试阶段的效率。

图3展示了14种算法在Mobo数据集上的运行时间。所有算法均采用MATLAB实现。除了DCC，GCR和GCR（m）在训练和测试阶段相比其它方法用时更少。然而，GCR和GCR（m）比DCC有着更高的分类准确率。单模型方法，如SANP，CHISD和AHSID并没有训练阶段，它们在测试阶段耗时更多，这是由于它们使用了基于近邻的分类方法，需要进行一对一的集合匹配。ISCRC与GCR类似，都是基于协作表示的方法，两者在训练阶段耗时类似，但是ISCRC在测试阶段耗时更多，这是由于其在测试阶段需要进行测试集合和所有训练集合的距离学习。本研究提出的SSsR通过学习测试集合的一个更加紧凑的表示从而节省了测试时间。基于同样原因，GCR也在测试阶段耗时优于CDL和RNP方法。

欢迎关注“HEBAU青年教师学术沙龙”公众平台

沙龙活动面向全校师生开放

期待您的加入与交流

发表于: 2018-07-092018-07-09 08:24:59
原文链接：https://kuaibao.qq.com/s/20180709F099G200?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

IJCV：河北农业大学刘博博士提出基于组协作表示的图像集分类方法

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐