前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR2018|Domain Adaptation Segmentation-pix2pixHD详解

CVPR2018|Domain Adaptation Segmentation-pix2pixHD详解

作者头像
AI深度学习求索
发布2018-12-11 17:19:25
1.7K0
发布2018-12-11 17:19:25
举报
文章被收录于专栏:AI深度学习求索

论文:High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

会议:CVPR2018

任务:利用条件 GAN 进行 2048 x 1024 分辨率的图像合成和处理

pix2pix:

Image-to-Image Translation, 使用Domain A的图片作为pix2pix 的输入,生成domain B的图片,利用判别器对图片对进行判别,如下图

D(real edge, fake image) --> fake

D(real edge, real image) --> real

限制: 生成256*256的图片,难以生成高分辨率图像;

pix2pixHD:

任务: 进行2048 x 1024 分辨率的图像合成和处理

方法:针对高分辨率的图片,利用GAN综合local和global的信息构建一个Coarse-to-fine 的架构完成从label生成高分辨率图片的任务,并且允许生成多风格(外观纹理不同)的图片以及允许实例操纵。

网络:Coarse-to-fine 生成器

生成器拆分成两个子网络 G={G1,G2}:全局生成器网络 G1利用全局信息 和局部增强网络 G2利用局部信息,前者输入和输出的分辨率保持一致(如 1024 x 512),后者输出尺寸(2048 x 1024)是输入尺寸(1024 x 512)的 4 倍(长宽各两倍)。

以此类推,如果想要得到更高分辨率的图像,只需要增加更多的局部增强网络即可(如 G={G1,G2,G3})。

多尺度判别器:相同的架构,使用不同尺度的图片作为输入进行判别器训练

视觉交互操作(interative visual manipulation):

先看一下结果:

从作者发布的视频中,可以看到,可以选择更换街景中车辆的颜色和型号,给街景图增加一些树木,或者改变街道类型(例如将水泥路变成十字路)。类似地,利用语义标注图合成人脸时,给定语义标注的人脸图像,你可以选择组合人的五官,调整大小肤色,添加胡子等。

这是这篇文章最有趣的一个部分,这是怎么做的呢?

通过使用Instance map,进行视觉交互式操作,对图片进行交互操作,网络如下:

将图片输入到Feature encoder network E得到图片的分割图,使用Instance-wise average pooling对feature maps进行pooling操作,从而得到图片的Features ,将图片的Labels和Featuresconcat到一起,输入Image generation network G生成目标图片。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI深度学习求索 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档