xmdxcsj 2018-06-14
新智元 今天
新智元编译
来源:sciencemag.org
编译:肖琴
【新智元导读】20年后的你长什么样?北京航空航天大学和密歇根州立大学的研究人员设计了一个AI系统,采用生成对抗网络(GAN),可以根据原始照片生成一个人年龄增长后的样子,甚至连发际线逐渐后移也能逼真地模拟。论文发表在CVPR 2018。
论文:https://arxiv.org/pdf/1711.10352.pdf
警方要搜寻一个失踪多年的人或逃犯时,有时候线索只有一张旧照片。艺术家或计算机程序可以尝试根据旧照片推测这些人今天的样子,但这两种方法都有缺陷。现在,科学家们已经能够利用AI来渲染照片中的人年老后的样子,其结果比以往的方法更加逼真。
来自北京航空航天大学和密歇根州立大学的研究人员设计了这样一个系统。该系统采用一种由两个部分组成的算法,即生成对抗网络(GAN)。第一部分以一张脸的照片作为输入,并生成目标年龄的同一个人年龄增长后的脸。在训练过程中,第二部分将生成的图像与该年龄的人的真实图像和原始图像进行对比,并提供反馈,以令第一部分改进生成图像的效果。
图1:年龄增长(ageing)的模拟结果(第1列是输入的图像)。
其他这类系统也有使用GAN的, 但这个系统的不同之处在于它不仅关注年龄的正确性,还关注保持特定人的身份。与其他系统不同的是,它还能渲染前额和发际线逐渐升高的样子,如上图演示的结果。
图2:提出的年龄增长方法的框架。
在这个框架中,一个基于CNN的生成器G学习年龄变化(age transformation)。训练中的critic在图像空间加入平方欧几里得损失,GAN loss鼓励生成的人脸与训练中相应年龄的老年人的脸无法区分,以及 identity preservation loss使高级特征表示的输入输出距离最小化。
这个研究的主要贡献如下:
24个不同的受试者在CACD数据库上获得的老化效果(Aging effects)。每个部分的第一个图像是原始的人脸图像,随后的3个图像是该受试者在[31- 40]、[41-50]和50+年龄组的变老图像。
图:24个不不同的受试者在MORPH数据库获得的老化效果。
研究人员在来自两个数据库的10万张图像上训练了他们的AI,这些数据库中包括不同年龄的警方存档的面部照片和名人照片。然后,研究者用一个独立的计算机程序判断AI在一组新图像上的表现。举例来说,当AI将人的照片老化20年以上时,原本30岁以下的人看起来应该在50岁至60岁之间,计算机程序将他们(平均)视为60岁(面部照片)或52岁(名人照片)。
图:与先前工作的对比
在进一步的统计调查中,研究人员从已发表的论文中收集了54个人的138张配对的照片,并邀请10位人类观察者来评估哪张年龄增长的脸更好。在1380票中,69.78%投给了我们的工作,20.80%投给了以前的工作,9.42%表示两者不分上下。此外,该方法不需要像以前的工作那样进行繁琐的预处理,只需要两个标志点用于瞳孔对齐。总而言之,研究者称他们提出的方法优于以前的方法。
相关论文发表在本月的CVPR 2018会议上。