深度学习算法(第29期)----可视化自编码器和无监督预训练

智能算法

发布于 2019-10-11 11:12:28

1.1K0

发布于 2019-10-11 11:12:28

文章被收录于专栏：智能算法

上期我们一起学习了深度学习中的如何高效的训练自编码器的相关知识，

深度学习算法(第28期)----如何高效的训练自编码器？今天我们一起学一下自编码器中相关的可视化方面以及无监督预训练方面的知识。

可视化重构

如何确保自编码器训练了一个合适的模型呢？一个常用的方法是比较模型的输入和输出，当输入和输出大体相似，并且不相似的地方也都是一些不重要的细节的时候，那么该模型算了可以了。我们以MNIST中随机挑选的两个数字为例：

其中左边的是原始数据，右边的是重构的数据，代码如下：

n_test_digits = 2
X_test = mnist.test.images[:n_test_digits]

with tf.Session() as sess:
    [...] # Train the Autoencoder
    outputs_val = outputs.eval(feed_dict={X: X_test})

def plot_image(image, shape=[28, 28]):
    plt.imshow(image.reshape(shape), cmap="Greys", interpolation="nearest")
    plt.axis("off")

for digit_index in range(n_test_digits):
    plt.subplot(n_test_digits, 2, digit_index * 2 + 1)
    plot_image(X_test[digit_index])
    plt.subplot(n_test_digits, 2, digit_index * 2 + 2)
    plot_image(outputs_val[digit_index])

从重构上看，输出已经和输入足够接近。因此，自编码器已经学会了如何生成和自己一样的输出，但是它到底学到了哪些有用的特征呢？

可视化特征

一旦我们自编码器学到了一些特征，我们就会想去看看到底到底有哪些特征。有很多技术可以实现，一般认为最简单的方法就是考虑每一个隐藏层中的每一个神经元，找到激活该神经元最多的训练样本。这在最顶层的隐藏层比较好用，因为它能捕获相对更大更具体一些的特征，然后就可以很容易的找到包含该特征的训练样本。比如，当一个神经元看到一只猫的时候，该神经元经常被激活，那么激活该神经元的大多数图片上应该都包含一只猫。然而对于低级的隐藏层，这种方法不是十分奏效，因为低层次的特征更加小而且更加抽象，因此很难去准确的理解什么到底什么输入激活了这些神经元。

还有一种方法，对于第一个隐藏层中的每个神经元，您可以创建一个图像，其中像素的强度对应于给定神经元的连接权重。例如，以下代码绘制了第一个隐藏层中五个神经元学习的特征：

with tf.Session() as sess:
    [...] # train autoencoder
    weights1_val = weights1.eval()

for i in range(5):
    plt.subplot(1, 5, i + 1)
    plot_image(weights1_val.T[I])

这样我们就得到了低层次的一些特征，如下图：