学界 | 让莫奈画作变成照片：伯克利图像到图像翻译新研究

机器之心

发布于 2018-05-07 14:39:51

9080

发布于 2018-05-07 14:39:51

文章被收录于专栏：机器之心

选自arXiv.org

机器之心编译

参与：李泽南

UC Berkeley 的研究者们在图像风格转换领域的探索一直引人注目，几个月前的人工智能生成「猫片」：edges2cats 图像转换系统风靡一时。最近，该论文作者之一 Jun-Yan Zhu 又为我们展示了另一种图像风格转换技术。经过训练，这种被称为 CycleGAN 的新方法可以让马变成斑马，莫奈的画作变成照片，橘子变成苹果……在论文发表后，研究小组在 GitHub 上公布了该项研究的 Torch 实现。读者可点击阅读原文下载此论文。

论文：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

摘要：图像到图像转换是一类视觉和图形问题，其目标是通过训练学习输入图片的风格，将其映射到框架类似的输出图片中。尽管对于很多任务而言，配对训练数据可遇不可求。我们提出了一种在没有配对的情况下从来源域 X 到目标域 Y 进行图像转换的方式。我们的目标是实现 G:X→ Y，其中 G(X) 的图像分布与使用对抗性损失分布的 Y 难以区分。因为映射非常不完全，我们将其以 F:Y→ X 的方式建立映射，同时引入循环一致性损失函数来推动 F(G(X))≈X（反之亦然）。我们在无法配对的训练数据中演示了新方法的成果，其中包括风格迁移、材质改变、季节变化、图像增强等。我们业余之前一些方法进行了定量比较，展示了新方法的优越性。