前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【论文研究】GAN压缩:为交互式图像合成铺平了道路

【论文研究】GAN压缩:为交互式图像合成铺平了道路

作者头像
GPUS Lady
发布2020-03-31 16:45:37
5290
发布2020-03-31 16:45:37
举报
文章被收录于专栏:GPUS开发者GPUS开发者

条件生成对抗网络(cGANs)为许多计算机视觉和图形应用提供了可控的图像合成。然而,最近的cGANs比现代识别CNNs的计算强度高1-2个数量级。例如,GauGAN每个映像消耗281G MACs,而MobileNet-v3只消耗0.44G MACs,这使得交互式部署非常困难。

麻省理工学院、Adobe研究中心以及上海交通大学的研究团队提出了一个通用的压缩框架来减少cGANs中生成器的推理时间和模型大小。直接应用现有的CNNs压缩方法会产生较差的性能,这是由于GAN训练的难度和生成器架构的差异造成的。

研究人员以两种方式应对这些挑战。

首先,为了稳定GAN训练,他们将原模型的多个中间表示的知识转移到其压缩模型中,将非成对和成对学习统一起来。

其次,他们的方法不是重用现有的CNN设计,而是通过神经架构搜索(NAS)自动找到有效的架构。

为了加速搜索过程,他们通过权值共享来解耦模型训练和架构搜索。

实验证明了在不同的监督设置(配对和不配对)、模型架构和学习方法(如pix2pix、GauGAN、CycleGAN)下的有效性。在不损失图像质量的前提下,他们将CycleGAN的计算量减少了20倍以上,GauGAN减少了9倍,为交互式图像合成铺平了道路。

团队在NVIDIA AGX Xavier NVIDIA边缘计算利器 AGX Xavier memory翻倍,更重要的是...)上做的对比测试:

以下是团队在Jetson NANO(关于二代Jetson NANO开发套件常见问题)上做的对比测试:

点击https://arxiv.org/pdf/2003.08936v1.pdf 可以访问具体的论文

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-03-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档