AI科技评论按:图像风格迁移一直都是一个十分有趣的研究方向,很多图像迁移工作都备受关注,比如颜色迁移,纹理迁移和风格转换。在图片分享类社交媒体的加持下,这些工作对群众的吸引力尤为明显。一些很流行的 APP 比如 Prisma 和 Facetune 就成功的利用了这种吸引力。浙江大学和中国香港科技大学的双料博士廖菁在 reddit 上分享过一篇关于风格迁移的论文,引起热烈讨论,原贴来自 reddit,论文 https://arxiv.org/abs/1705.01088,代码https://github.com/msracver/Deep-Image-Analogy 。 AI 科技评论对论文及原贴编译如下。
廖菁博士团队提出了一种名为深度图像对比的新图像风格迁移技术,经该技术迁移后的图片可能变成风格迥异的另一张图片,但其实它们拥有相同的语义结构。通过这种风格迁移技术,他们可以将颜色、色调、纹理、样式等视觉信息从一张图片迁移到另一张图片。举例说明,比如对同一场景的记录,可以通过绘画或素描,也可以通过拍照,这两种风格之间可以进行迁移。他们的技术可以发现两张图片语义上的稠密对应,实现方式是将「图片对比」与用于匹配的深度卷积神经网络所提取的特征进行融合,他们将该技术称为深度图片对比。他们采用由粗到细的策略来计算出最近邻场。他们还证明了他们所提技术的广泛适用性,比如风格-纹理迁移,颜色-风格互换,草图绘画-照片迁移等。
如上图所示,所谓语义结构相同其实是指两张图具有相似的可识别的高级视觉元素,而廖菁博士团队提出的技术可以在两张图片的视觉元素之间建立起稠密对应,这也就为风格迁移提供了基础。而这种稠密对应所用到的理念是「图片对比」(可以对图片的不同区域进行稠密映射)。在计算最近邻场方面,他们则是拓展了 PatchMatch 算法,对其进行重构使它可以应用到特征领域。最终的效果如上图所示,A 及 B'相似,但风格有明显差异,最终 B'的风格迁移至 A 生成 A',而 A 的风格迁移至 B'生成 B。
总结起来该方法大致涉及三项工作。一是视觉属性迁移,这一方向已经有不少工作,包括颜色迁移、纹理迁移。风格迁移,图片对比。但是这些工作的应用场景是特定的,而廖菁博士团队的则更加泛化。二是稠密对应,发现两幅图像之间的稠密对应是计算机视觉和图形学中的一个基础性问题。初始匹配方法被设计用于立体匹配、光流和图像对准。这些方法可以计算密集的对应场,但是它们假定亮度的一致性和局部运动,并且可能很难处理遮挡问题。三是神经风格迁移,他们使用的匹配算法利用的是深度卷积神经网络生成的深度特征,这些深度特征在一些高级识别任务中证明了它们可以更好地代表图片。DeepDream 最近尝试过用 CNN 生成一些艺术性工作。这对神经风格转换具有启发作用,近期也有人成功将 CNN(预训练的 VGG-16)应用于风格迁移和纹理迁移。
廖菁博士团队在各个转换方式上的实验结果部分展示如下:
照片转图片
图片互转
图片转照片
照片间迁移
该贴在 reddit 上引起热烈讨论,AI 科技评论挑选出部分网友提问及观点:
廖静博士团队提出的这项技术将「图像类比」的概念应用到深层特征空间中去寻找语义上有意义的稠密对应。该方法优于以前的方法,且该方法适用性更广。他们认为该方法对于计算机图像学和计算机视觉中那些依赖于语义对应的工作很有帮助。
以上就是 AI 科技评论reddit原贴的解读。