UFLDL笔记——自我学习

felixzhao

发布于 2018-03-19 17:02:48

8580

发布于 2018-03-19 17:02:48

文章被收录于专栏：null的专栏

注：最近打算将UFLDL教程重新看一遍，其实里面有很多关于神经网络以及深度学习的知识点很有用，但是只是学习深度学习的话有一些内容就有点多余，所以想整理一个笔记，记录下神经网络到深度学习的一些知识点。整个教材已经非常好，网上有原版的英文版，也有翻译的中文版，这个只是自己的学习笔记，对原来教程中的内容进行了梳理，有些图也是引用的原来的教程，若内容上有任何错误，希望与我联系，若内容有侵权，同样也希望告知，我会尽快删除。

这个笔记主要分为以下几个部分： - 神经网络 - 自编码器与稀疏性 - Softmax回归 - 自我学习 - 深度网络 - 其他，如PCA

四、自我学习

1、自我学习的概念

在现实生活中存在着大量的无标注的数据，即数据中只存在着特征属性，而没有类别标签，要想有效地利用这些无标注的数据，一种办法是人工标注这些数据，然而，人工标注这些数据需要花费大量的人力和物力。另一种方法是利用算法对这些无标注的数据进行学习，学习出更好的特征描述，自我学习便是这样一个概念，即从大量的无标注的数据中学习到特征的更好表示。

1、特征学习

在前面介绍了使用自编码器学习到特征的表示方法，具体过程为，对于mm无标注的训练样本{x(1),x(2),⋯,x(m)}，可以学到如下的稀疏自编码器模型：

其中，稀疏自编码器的模型参数为：W(1),b(1),W(2),b(2)。对于稀疏自编码器模型来说，隐含层代表的是特征的另一种表示，可能是一种更好的表示，如下图所示：

假设有mlm_l个标注的样本{(x(1),y(1)),(x(2),y(2)),⋯,(x(m1),y(ml))}，利用稀疏自编码模型得到更好的特征表示。如对于输入x(1)\mathbf{x}^{(1)}，经过稀疏编码器得到其特征表示为a(1)，通常有两种方法处理这两种特征表示：

“替代表示(Replacement Representation)”，即直接将a(1)替代x(1)。
“级联表示(Concatenation Representation)”，即将上述两种特征组合在一起，使用新向量(x(1),a(1))代替原先的特征x(1)

经变换后的特征变成了替代表示{(a(1),y(1)),(a(2),y(2)),⋯,(a(m1),y(ml))}或者是级联表示{((x(1),a(1)),y(1)),((x(2),a(2)),y(2)),⋯,((x(m1),a(m1)),y(ml))}

通常采用级联表示可以或得更好的效果。

对于上述的特征表示，可以对其使用常用的分类器，如SVM，Logistic回归等等对其进行学习和预测。

2、从自我学习到深层网络

在自我学习的过程中，首先通过未标注的数据训练一个稀疏自编码器，即对于给定的未标注的样本{x(1),x(2),⋯,x(m)}，训练过程如下图所示：

对于一个新的样本x \mathbf{x}，我们可以通过训练好的稀疏自编码器提取出其特征a \mathbf{a}。然而对于一个分类问题，我们关心的是样本的标签yy，对于有标注的样本{(x(1),y(1)),(x(2),y(2)),⋯,(x(m1),y(ml))}，利用训练好的稀疏自编码器得到新的特征a \mathbf{a}，利用替代表示，得到新的数据集表示形式{(a(1),y(1)),(a(2),y(2)),⋯,(a(m1),y(ml))}，我们需要训练的是从特征a到标签yy的映射，可以使用logistic回归分类器，其具体形式如下：