CVPR 2018:用GAN预测20年后你长什么样


新智元编译

来源:sciencemag.org

编译:肖琴

【新智元导读】20年后的你长什么样?北京航空航天大学和密歇根州立大学的研究人员设计了一个AI系统,采用生成对抗网络(GAN),可以根据原始照片生成一个人年龄增长后的样子,甚至连发际线逐渐后移也能逼真地模拟。论文发表在CVPR 2018。

论文:https://arxiv.org/pdf/1711.10352.pdf

警方要搜寻一个失踪多年的人或逃犯时,有时候线索只有一张旧照片。艺术家或计算机程序可以尝试根据旧照片推测这些人今天的样子,但这两种方法都有缺陷。现在,科学家们已经能够利用AI来渲染照片中的人年老后的样子,其结果比以往的方法更加逼真。

来自北京航空航天大学和密歇根州立大学的研究人员设计了这样一个系统。该系统采用一种由两个部分组成的算法,即生成对抗网络(GAN)。第一部分以一张脸的照片作为输入,并生成目标年龄的同一个人年龄增长后的脸。在训练过程中,第二部分将生成的图像与该年龄的人的真实图像和原始图像进行对比,并提供反馈,以令第一部分改进生成图像的效果。

图1:年龄增长(ageing)的模拟结果(第1列是输入的图像)。

其他这类系统也有使用GAN的, 但这个系统的不同之处在于它不仅关注年龄的正确性,还关注保持特定人的身份。与其他系统不同的是,它还能渲染前额和发际线逐渐升高的样子,如上图演示的结果。

图2:提出的年龄增长方法的框架。

在这个框架中,一个基于CNN的生成器G学习年龄变化(age transformation)。训练中的critic在图像空间加入平方欧几里得损失,GAN loss鼓励生成的人脸与训练中相应年龄的老年人的脸无法区分,以及 identity preservation loss使高级特征表示的输入输出距离最小化。

这个研究的主要贡献如下:

  • 提出了一种新的基于GAN的年龄发展方法,该方法结合了人脸验证和年龄估计技术,从而解决了衰老效果生成和身份线索保存的问题。
  • 强调了前额和头发的重要性,这与我们认知的年龄增长现象密切相关,但在其他研究中被忽略了;这确实提高了所生成的衰老照片的精度。
  • 除了现有的实验外,研究者还设置了新的验证实验,包括基于商业化的面部分析工具的评估以及对表情、姿势和化妆变化的不敏感性评估。该方法不仅被证明有效,而且对于年龄增长也具有稳健性。

24个不同的受试者在CACD数据库上获得的老化效果(Aging effects)。每个部分的第一个图像是原始的人脸图像,随后的3个图像是该受试者在[31- 40]、[41-50]和50+年龄组的变老图像。

图:24个不不同的受试者在MORPH数据库获得的老化效果。

研究人员在来自两个数据库的10万张图像上训练了他们的AI,这些数据库中包括不同年龄的警方存档的面部照片和名人照片。然后,研究者用一个独立的计算机程序判断AI在一组新图像上的表现。举例来说,当AI将人的照片老化20年以上时,原本30岁以下的人看起来应该在50岁至60岁之间,计算机程序将他们(平均)视为60岁(面部照片)或52岁(名人照片)。

图:与先前工作的对比

在进一步的统计调查中,研究人员从已发表的论文中收集了54个人的138张配对的照片,并邀请10位人类观察者来评估哪张年龄增长的脸更好。在1380票中,69.78%投给了我们的工作,20.80%投给了以前的工作,9.42%表示两者不分上下。此外,该方法不需要像以前的工作那样进行繁琐的预处理,只需要两个标志点用于瞳孔对齐。总而言之,研究者称他们提出的方法优于以前的方法。

相关论文发表在本月的CVPR 2018会议上。


原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

文字直接转视频,科学家用机器学习算法实现这种操作 | 黑科技

1064
来自专栏机器之心

观点 | 深度学习虽好,但也有深度的烦恼

选自SIAM 作者:Michael Elad 机器之心编译 参与:微胖、李泽南 本文作者 Michael Elad 是以色列理工学院的计算机科学教授,他也是学术...

2756
来自专栏AI科技大本营的专栏

AI 技术讲座精选:迁移学习——让机器学习投资回报率加倍

Google 曾训练出一台智能计算机,打败了围棋世界冠军李世石。 这对今天的商业有什么样的指导意义呢? ? 目前,研究人员正在借助机器学习(ML)来挖掘计算机...

2744
来自专栏AI研习社

测量神经网络真的难吗?Uber 说未必

过去十年来,神经网络彻底改变了机器学习。机器学习从一个相对晦涩的学术研究领域崛起成为工业支柱,在大量数据可用的地方为众多应用提供支持。Uber 将神经网络用于多...

893
来自专栏AI科技评论

动态 | DeepMind 弹性权重巩固算法让 AI 拥有“记忆” ,将成机器高效学习的敲门砖

一直以来,计算机程序都是个“左耳进,右耳出”的“傻小子”,它们很快就会忘掉所做过的任务。DeepMind 决定改变传统的学习法则,让程序在学习新任务时也不忘掉旧...

3578
来自专栏新智元

2016:深度学习统治人工智能?附深度学习十大顶级框架

2015 年结束了,是时候看看 2016 年的技术趋势,尤其是关于深度学习方面。新智元在 2015 年底发过一篇文章《深度学习会让机器学习工程师失业吗?》,引起...

3416
来自专栏新智元

【Yoshua Bengio 亲自解答】机器学习 81 个问题及答案(最全收录)

这是 Quora 的最新节目,针对特定话题进行系列的问答。如果你不了解 Quora,可以把它看作美国版的知乎,不过里面大咖云集,奥巴马、Elon Musk、Bi...

2705
来自专栏新智元

DeepMind用深度学习模仿大脑推理,预测编码智能推进一大步!

【新智元导读】预测编码理论认为,大脑的感知、运动控制、记忆及其他高级功能,取决于真实经历和大脑对未来的预测之间的差异。DeepMind新推出的“生成查询网络”模...

741
来自专栏新智元

拥抱深度学习还是数学的优雅?神经网络对图像处理、数学和人类的影响

【新智元导读】本文作者 Michael Elad 是以色列理工学院计算机科学系教授,也是成像科学期刊 SIAM 的主编。他对当前图像领域使用深度学习的矛盾做了深...

54917
来自专栏新智元

2016 年不容错过的 30 个机器学习视频、教程&课程

【新智元导读】2016 年就要过去了,关于机器学习的知识储备你觉得自己做得如何?下面是 Analytics Vidhya 网站发表的文章,汇集了 2016 年机...

3475

扫码关注云+社区