CVPR 2018:用GAN预测20年后你长什么样


新智元编译

来源:sciencemag.org

编译:肖琴

【新智元导读】20年后的你长什么样?北京航空航天大学和密歇根州立大学的研究人员设计了一个AI系统,采用生成对抗网络(GAN),可以根据原始照片生成一个人年龄增长后的样子,甚至连发际线逐渐后移也能逼真地模拟。论文发表在CVPR 2018。

论文:https://arxiv.org/pdf/1711.10352.pdf

警方要搜寻一个失踪多年的人或逃犯时,有时候线索只有一张旧照片。艺术家或计算机程序可以尝试根据旧照片推测这些人今天的样子,但这两种方法都有缺陷。现在,科学家们已经能够利用AI来渲染照片中的人年老后的样子,其结果比以往的方法更加逼真。

来自北京航空航天大学和密歇根州立大学的研究人员设计了这样一个系统。该系统采用一种由两个部分组成的算法,即生成对抗网络(GAN)。第一部分以一张脸的照片作为输入,并生成目标年龄的同一个人年龄增长后的脸。在训练过程中,第二部分将生成的图像与该年龄的人的真实图像和原始图像进行对比,并提供反馈,以令第一部分改进生成图像的效果。

图1:年龄增长(ageing)的模拟结果(第1列是输入的图像)。

其他这类系统也有使用GAN的, 但这个系统的不同之处在于它不仅关注年龄的正确性,还关注保持特定人的身份。与其他系统不同的是,它还能渲染前额和发际线逐渐升高的样子,如上图演示的结果。

图2:提出的年龄增长方法的框架。

在这个框架中,一个基于CNN的生成器G学习年龄变化(age transformation)。训练中的critic在图像空间加入平方欧几里得损失,GAN loss鼓励生成的人脸与训练中相应年龄的老年人的脸无法区分,以及 identity preservation loss使高级特征表示的输入输出距离最小化。

这个研究的主要贡献如下:

  • 提出了一种新的基于GAN的年龄发展方法,该方法结合了人脸验证和年龄估计技术,从而解决了衰老效果生成和身份线索保存的问题。
  • 强调了前额和头发的重要性,这与我们认知的年龄增长现象密切相关,但在其他研究中被忽略了;这确实提高了所生成的衰老照片的精度。
  • 除了现有的实验外,研究者还设置了新的验证实验,包括基于商业化的面部分析工具的评估以及对表情、姿势和化妆变化的不敏感性评估。该方法不仅被证明有效,而且对于年龄增长也具有稳健性。

24个不同的受试者在CACD数据库上获得的老化效果(Aging effects)。每个部分的第一个图像是原始的人脸图像,随后的3个图像是该受试者在[31- 40]、[41-50]和50+年龄组的变老图像。

图:24个不不同的受试者在MORPH数据库获得的老化效果。

研究人员在来自两个数据库的10万张图像上训练了他们的AI,这些数据库中包括不同年龄的警方存档的面部照片和名人照片。然后,研究者用一个独立的计算机程序判断AI在一组新图像上的表现。举例来说,当AI将人的照片老化20年以上时,原本30岁以下的人看起来应该在50岁至60岁之间,计算机程序将他们(平均)视为60岁(面部照片)或52岁(名人照片)。

图:与先前工作的对比

在进一步的统计调查中,研究人员从已发表的论文中收集了54个人的138张配对的照片,并邀请10位人类观察者来评估哪张年龄增长的脸更好。在1380票中,69.78%投给了我们的工作,20.80%投给了以前的工作,9.42%表示两者不分上下。此外,该方法不需要像以前的工作那样进行繁琐的预处理,只需要两个标志点用于瞳孔对齐。总而言之,研究者称他们提出的方法优于以前的方法。

相关论文发表在本月的CVPR 2018会议上。


原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏工科狗和生物喵

【毕设进行时-工业大数据,数据挖掘】第一天收获

【个人看法】 支持向量机的核心与决策树类似。但是还是有不同之处,现在多学习下支持向量机,后面用自己的算法也行。或者给出多个版本的话,可以作为几个方案去解释!

1272
来自专栏机器之心

论文结果难复现?本文教你完美实现深度强化学习算法DQN

3157
来自专栏灯塔大数据

每周学点大数据 | No.58协同过滤模型(上)

NO.58 协同过滤模型(上) Mr. 王:为了能够有效地利用其他用户的评价来进行更有效的推荐,人们提出了协同过滤的推荐模型。 小可:那什么是协同过滤模型呢?它...

3099
来自专栏CDA数据分析师

干货 | 机器学习没有你想的那么复杂

人脑是最神奇的。你知道我更感兴趣的是什么吗?是我们的学习能力。我们如何能够适应并学习全新的技能,然后应用到日常生活之中呢?

714
来自专栏AI研习社

视频 | 10行代码,用大脑重量预测体重!硅谷AI网红亲身示范

Siraj Raval 作为深度学习领域的自媒体人在欧美可以说是无人不知、无人不晓。 凭借在 Youtube 上的指导视频,Siraj Raval 在全世界吸...

4346
来自专栏量子位

连LeCun都推荐的Fashion-MNIST数据集,是这位华人博士的成果

允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上周六,量子位在报道中提到德国时尚圈的科学家,推出一个名叫Fashion-MNIST的数据集。这个数...

3945
来自专栏数据派THU

【独家】考察数据科学家和分析师的41个统计学问题

作者:Dishashree Gupta 翻译:闵黎 卢苗苗 校对:丁楠雅 本文长度为6500字,建议阅读20分钟 本文是Analytics Vidhya所举...

20910
来自专栏腾讯Bugly的专栏

【Dev Club 分享】深度学习在 OCR 中的应用

Dev Club 是一个交流移动开发技术,结交朋友,扩展人脉的社群,成员都是经过审核的移动开发工程师。每周都会举行嘉宾分享,话题讨论等活动。 本期,我们邀请了 ...

5578
来自专栏机器之心

学界 | 深度神经网络比拼人类视觉:信号弱时的物体识别差异

选自arXiv 机器之心编译 参与:Smith 近日,来自德国 Tubingen大学和Potsdam大学的研究人员们共同发布了一项研究成果——深度神经网络和人类...

2805
来自专栏语言、知识与人工智能

从用户行为去理解内容-item2vec及其应用

从内容属性去理解用户行为,预测用户行为,那么也可以通过理解用户行为去理解内容,预测内容属性。

2.7K10

扫码关注云+社区