首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

ICLR 2019 | 有效稳定对抗模型训练过程,伯克利提出变分判别器瓶颈

对抗性学习方法为具有复杂的内部关联结构的高维数据分布的建模提供了一种很有发展前景的方法。这些方法通常使用判别器来监督生成器的训练,从而产生与原始数据极为相似、难以区分的样本。生成对抗网络(GAN)就是对抗性学习方法的一个实例,它可以用于高保真的图像生成任务(Goodfellow et al., 2014; Karrasrt et al.,2017)和其他高维数据的生成(Vondrick et al.,2016;Xie et al.,2018;Donahue et al.,2018)。在逆向强化学习(inverse reinforcement learning)框架中也可以使用对抗性方法学习奖励函数,或者直接生成模仿学习的专家演示样例(Ho & Ermon, 2016)。然而,对抗性学习方法的优化问题面临着很大的挑战,如何平衡生成器和判别器的性能就是其中之一。一个具有很高准确率的判别器可能会产生信息量较少的梯度,但是一个弱的判别器也可能会不利于提高生成器的学习能力。这些挑战引起了人们对对抗性学习算法的各种稳定方法的广泛兴趣(Arjovsky et al., 2017; Kodali et al., 2017; Berthelot et al., 2017)。

02
领券