使用tanh作为激活函数时,loss变化情况如下:
可以观察到,loss收敛到0.0685,效果较好.使用relu作为激活函数同样能够有效收敛,不过误差数值相对较大.由于篇幅原因不将图片在此进行展示...可以看到,在两个训练阶段,方法可以有效的达到收敛....可以看到和stacked AE的主要区别在于局部卷积连接,而不所有层都是全连接。...可以看散度可以收敛到145的情况,能够有效进行收敛.
在自监督的训练过程,使用 KL散度+方均根 作为loss函数,loss变化情况如下.
对于两种损失函数效果的讨论在下文中进行....方法在图像生成领域有出色的表现,将中间的隐变量约束为正太分布的形式,十分方便的通过生成器完成图像生成.
5.在研究角度,VAE方法将概率方法引入神经网络的计算体系中,通过网络完成对概率分布的映射,使用散度的概念构造损失函数