ECCV 2018 | 腾讯AI Lab提出正交深度特征分解算法:在多个跨年龄人脸识别任务中创造新记录

机器之心发布

腾讯 AI Lab

作者:Yitong Wang、Dihong Gong、Zheng Zhou、Xing Ji、Hao Wang、Zhifeng Li、Wei Liu、Tong Zhang

这项工作由腾讯 AI Lab 独立完成,其目的是通过研发新的深度学习模型以提高跨年龄人脸识别的精度。

在这篇文章里,我们提出了一种正交深度特征分解算法 OE-CNNs,通过把深度特征正交分解为年龄分量和身份分量,从而将年龄分量和身份分量有效分离开,从而达到减少年龄差异、提高跨年龄人脸识别精度的目标。

我们在多个跨年龄人脸识别的国际评测基准(FG-NET, Morph Album 2, CACD-VS)中都取得了国际领先的性能,显著提高了跨年龄人脸识别的精度。此外,我们还建立了一个新的跨年龄人脸数据库 CAF 以帮助促进跨年龄人脸识别研究。

跨年龄人脸识别是人脸识别领域中的一个极具挑战性的国际性难题。众所周知,同一个人的不同年龄阶段的图片会有非常大的差异,这些差异会严重影响到跨年龄人脸识别的精度。迄今为止,深度学习已经被广泛运用到人脸识别,并且取得了非常好的性能。但是,对于跨年龄人脸识别,问题,由于同一个人在不同年龄阶段下的多张人脸之间存在着非常显著的差异,这严重影响到现有的深度人脸识别模型的性能。为了克服这个巨大的年龄差异,在这篇文章里我们研发了一种新的深度学习算法,该算法把深度特征按照模长方向和角度方向(这两个方向是彼此正交的)分别分解为年龄成分和身份成分,如下图所示。

其中,年龄成分被分解成一维径向分量,而身份成分则分解为高维角度分量。这两种分量最后通过多任务学习的方式同时训练,最终的损失函数是二者损失的算术叠加:

其中身份成分的损失函数

而年龄成分的损失函数

基于这种新的分解模型我们可以把人脸的年龄分量和身份分量有效分离开,并基于身份分量来做跨年龄人脸识别从而有效提高跨年龄人脸识别的精度。

为了进一步提高跨年龄人脸识别性能,我们还采集了一个面向跨年龄人脸识别的的新型人脸数据库 CAF。我们通过在网上搜集名人在不同年龄段拍的照片,以保证这些训练图片有足够大的年龄差异。我们的搜集的人名来源于公共的信息库,比如 IMDB, Forbes Celebrity, Wikipedia 等。我们的 CAF 数据库有 4,668 个不同的人和这些人的 313,000 张图片。这个数据库的样例和统计分布如下图所示。

实验结果

在上表的 FG-NET 跨年龄人脸识别任务中,我们的新算法 OE-CNNs 取得了高达 53.26% 的第一识别率,比第二名的 38.21% 足足高了超过 15% 的识别率。

在上表的 Morph Album 2 识别任务中,我们的算法也稳定地高于其它所有的人脸算法。

在上表的对比实验中,能明显看出增加了我们新建立的 CAF 人脸数据做训练后,对于上表中的所有人脸算法,它们的识别率都能显著获得提升,这证明了 CAF 对于跨年龄人脸识别研究的帮助和价值。

本文为机器之心发布,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-09-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

博客 | 一个项目的经验教训:关于打乱和拆分数据

最近因为某事要准备一点材料,刚好前段时间给导师做项目的时候遇到一个大坑,浪费了很多时间,所以就着这个问题顺便做点总结。

20520
来自专栏大数据文摘

让冰冷的机器看懂这个多彩的世界

30990
来自专栏数据派THU

独家 | 如何改善你的训练数据集?(附案例)

这张幻灯片是Andrej Karpathy 在Train AI 演讲的一部分,我很赞同它表达的观点。它充分体现了深度学习在研究和应用上的差异。学术论文几乎全部集...

11940
来自专栏专知

何谓“人工智能”?如何做到“强人工智能”?

本文是工程师Narasimha Prasanna HN撰写的技术博文,主要介绍人工智能的概念,当前人工智能的水平,以及什么是强人工智能,当前实现强人工智能的方向...

56460
来自专栏SIGAI学习与实践平台

人工智能非技术从业者必知的十件事

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

13810
来自专栏互联网数据官iCDO

跟你想的不同!Look-alike用户行为模拟建模背后的科学分析

译者注: Look-alike模型是我们关心的领域。 做数字营销的朋友们,希望打破流量的铁律——随着流量数量的增大,流量的质量必然会逐步下降。流量质量下降的原因...

57650
来自专栏目标检测和深度学习

逆天!MIT新“像素发声”系统,完美分离声与画(附视频)

新智元报道 来源:MIT CSAIL 编辑:小潘、克雷格 【新智元导读】麻省理工学院(MIT)的计算机科学与人工智能实验室(CSAIL)最近研发出一种名...

30750
来自专栏PPV课数据科学社区

译文:安德鲁.M.莫尔的教程(一) PDF下载

安德鲁•W•穆尔简介 卡耐基梅隆大学的计算机科学学院院长,机器学习、人工智能、机器人技术,大数据统计计算行业背景,热爱算法和统计,最喜欢机器人技术。 曾在机...

36660
来自专栏EAWorld

AIDevOps离我们有多远?

本文目录: 一、写在前面 二、AIDevOps,未来已来 三、AIDevOps的方法 四、学术界的研究启示 五、距离AIDevOps还有多远? 六、参考文献 一...

43560
来自专栏cloudskyme

跟我一起数据挖掘(19)——什么是数据挖掘(2)

什么是数据仓库? 数据仓库是一个面向主题的( Subject Oriented) 、集成的( Integrate) 、相对稳定的(NonVolatile) 、反...

41450

扫码关注云+社区

领取腾讯云代金券