TensorFlow基础入门

注:这篇文章的内容来自课程[Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization]的编程练习。coursera上的编程练习设计得非常贴心,一步步引导学员完成练习,对于编程基础薄弱的同学尤为友好。

到目前为止,您一直使用numpy来构建神经网络。现在我们将引导您使用一个深度学习框架,让您可以更轻松地构建神经网络。TensorFlow、PaddlePaddle、Torch、Caffe、Keras等机器学习框架可显著加速机器学习开发。在此作业中,您将学习在TensorFlow中执行以下操作:

初始化变量

开始会话

训练算法

实施神经网络

编程框架不仅可以缩短编码时间,而且有时还可以执行优化来加速代码。

1 - 探索Tensorflow程序库

首先,请导入相关库:

现在您已经导入了该库,我们将引导您完成不同的应用程序。您将从一个例子开始,在这里我们为您计算一个训练样例的损失。

在TensorFlow中编写和运行程序有以下步骤:

创建尚未执行/评估的张量(变量)。

在这些张量之间写入操作。

初始化张量。

创建一个会话。

运行会话,它将运行您上面写的操作。

因此,当我们为损失创建一个变量时,我们简单地将损失定义为其他数的函数,但没有评估它的值。为了评估它,我们必须运行init=tf.global_variables_initializer()。它初始化损失变量,并在最后一行代码中,评估损失的值并打印其值。

现在让我们看一个简单的例子:

输出为Tensor(“Mul:0”, shape=(), dtype=int32)

正如所料,您不会看到20!而是得到一个张量,结果是一个没有shape属性的张量,它的类型是”int32”。您所做的只是放在’计算图’中,但您还没有运行这个计算。为了真正相加这两个数字,您将不得不创建一个会话并运行它。

输出为20

很棒! 总结一下,记得初始化变量,创建一个会话并在会话中运行这些操作

接下来,您还必须了解占位符。占位符是一个对象,其值只能在稍后指定。要指定占位符的值,可以使用”馈送字典”(feed_dict变量)传入值。下面,我们为x创建了一个占位符,这允许我们稍后在运行会话时传入一个数字。

输出为6

当您第一次定义x时,您不必为它指定一个值。占位符只是一个变量,您将仅在以后运行会话时分配数据。也就是说您在运行会话时向这些占位符提供数据

以下是所发生的事情:当您指定计算所需的操作时,也就是告诉TensorFlow如何构建计算图。计算图可以有一些占位符,其值将在稍后指定。最后,当您运行会话时,告诉TensorFlow执行计算图。

1.1 - 线性函数

让我们通过计算以下等式来开始编程练习:Y = WX + bY,其中W和X是随机矩阵,b是随机向量。

练习:计算WX + b,其中W,X和b符合随机正态分布。W的形状是(4,3),X为(3,1),b是(4,1)。作为一个示例,下面代码是如何定义一个具有shape(3,1)的常量X:

您可能会发现以下函数很有用:

1.2 - 计算sigmoid

非常棒! 您刚刚实现了一个线性函数。Tensorflow提供了各种常用的神经网络函数,如tf.sigmoid和tf.softmax。对于这个练习,我们计算一个输入的sigmoid函数。

您将使用占位符变量x执行此练习。运行会话时,应该使用馈送字典传入z。在本练习中,您需要(1) 创建一个占位符x,(2) 使用tf.sigmoid定义计算sigmoid值,然后(3) 运行会话。

练习:实现下面的sigmoid函数,参考使用以下代码:

请注意,有两种典型的方式来创建和使用tensorflow中的会话:

方法1:

方法2:

总结一下,您现在知道如何:

创建占位符

指定计算对应的计算图

创建会话

运行会话,必要时使用馈送字典来指定占位符变量的值。

1.3 - 计算代价(cost)

您也可以使用内置函数来计算神经网络的代价。因此,您大可不必编写代码计算函数:

在tensorflow中只需一行代码即可完成!

练习:实现交叉熵损失,您将使用的函数是:

1.4 - 使用一位有效编码(One Hot encoding)

在很多深度学习里,您会得到一个y向量,数字范围从0到C-1,其中C是类的数量。比如C为4,那么您可能得到以下的y矢量,您需要按如下方式进行转换:

这通常称为”一位有效(one hot)”编码,因为在转换的表示中,每列的对应元素是”有效位(hot)”(意思是设置为1)。要在numpy中进行这种转换,您可能需要编写好几行代码。在tensorflow中,只需一行代码:

练习:运行下面的函数,取一个标签向量和类别总数C,返回one hot编码。请使用tf.one_hot()来实现。

1.5 - 使用零和一初始化

现在您将学习如何初始化一个零和一的向量。你要调用的函数是tf.ones()。要用零初始化,你可以使用tf.zeros()来代替。这些函数传入一个shape,分别返回一个全部元素为0和1的且维数等于shape的数组。

练习:实现下面的函数,传入shape并返回一个数组(维数和shape相同)。

2 - 在tensorflow中构建您的第一个神经网络

在这部分任务中,您将使用tensorflow建立一个神经网络。请记住,实现tensorflow模型分为两部分:

创建计算图

运行图

让我们深入探讨您要解决的问题!

2.0 - 问题陈述:SIGNS数据集

有一天下午,和一些朋友一起,我们决定教电脑破译手语。我们花了几个小时在白墙前拍摄照片,得到了以下数据集。现在您的工作是构建一个算法,以便帮助语言障碍人士与不懂手语的人进行沟通。

训练数据集:1080个图片(64×64像素),代表从0到5的手势(每个数字180张图片)。

测试数据集:120张图片(64×64像素),代表从0到5的手势(每个数字20张图片)。

请注意,这是SIGNS数据集的一个子集。完整的数据集包含更多的手势。

以下是每个数字的示例,以及我们如何表示标签。这些是在我们将图像解像度降低到64×64像素之前的原始图片。

运行以下代码以加载数据集。

通常,我们需要将图像数据集压平(flatten),然后除以255将其归一化。最重要的是,将每个标签转换为one hot矢量。运行下面的代码以执行此操作。

number of training examples = 1080

number of test examples = 120

X_train shape: (12288, 1080)

Y_train shape: (6, 1080)

X_test shape: (12288, 120)

Y_test shape: (6, 120)

请注意,12288来自64×64×364×64×3。每个图像是方形的,64×64像素,3是RGB颜色。在继续任务之前,请确保您了解所有这些形状的含义。

您的目标是构建能够高准确度识别手势的算法。要做到这一点,您要建立一个tensorflow模型,这个模型几乎和您之前使用numpy构建的猫识别模型一样(但现在使用softmax输出)。将您的numpy实现与tensorflow实现进行比较是一个不错的点子。

模型定义为LINEAR -> RELU -> LINEAR -> RELU -> LINEAR -> SOFTMAX。SIGMOID输出层替换为SOFTMAX。当超过两个类别时,SOFTMAX层比SIGMOID更通用。

2.1 - 创建占位符

您的第一项任务是为X和Y创建占位符,可以稍后在运行会话时传递训练数据。

练习:执行下面的函数以创建tensorflow中的占位符。

2.2 - 初始化参数

您的第二个任务是在tensorflow中初始化参数。

练习:执行下面的函数来初始化tensorflow中的参数。您将使用Xavier来初始化权重,使用零初始化偏置,其形状如下所示。作为一个示范,对于W1和b1您可以使用:

请使用seed = 1来确保您的结果与我们的结果相符。

2.3 - Tensorflow中的前向传播

您现在将实现tensorflow中的前向传播模块。该函数将接收参数字典并完成前向传递。您将使用的函数有:

问题:实现神经网络的前向传递。我们为您添加了numpy等价代码注释,以便您可以将tensorflow实现与numpy进行比较。重要的是要注意前向传播在z3处停止。原因在于,在tensorflow中,最后的线性层输出作为输入给计算损失的函数。因此,您不需要a3!

2.4 - 计算代价

如前所见,使用以下方法计算代价非常简单:

问题:实现如下代价函数。

2.5 - 反向传播 & 参数更新

这里您要感谢编程框架。所有反向传播和参数更新都在1行代码里处理,模型中加入这行代码非常容易。

计算代价函数后,您将创建一个“优化器”对象。运行tf.session时,必须一起调用此对象与代价。当被调用时,它将使用所选择的方法和学习速率对给定代价进行优化。

例如,梯度下降优化器:

要进行优化,您应该这样做:

通过tensorflow图以相反顺序来计算反向传播,从代价到输入。

注意编码时,我们经常使用_作为“一次性”变量来存储我们稍后不需要使用的值。这里,_返回我们不需要的优化器的评估值(c取值代价变量)。

2.6 - 构建模型

现在,将把它们组合在一起!

练习:实现模型。您将会调用之前实现的功能。

运行下面的代码来训练您的模型!在我们的机器上大约需要5分钟。

令人惊讶的是,您的算法可以识别代表0到5之间的数字的手势,精确度为71.7%。

总结

您的模型看起来足够大,足以适应训练集。但是,考虑到训练和测试之间的精度差异,您可以尝试添加L2或dropout正则化来减少过拟合。

将会话视为一组代码来训练模型。每次在小批次上运行会话时,都会训练参数。总的来说,您已经运行了很多次(1500个epoch)的会话,直到您获得训练好的参数。

2.7 - 使用自己的图片进行测试

祝贺您完成这项任务。现在可以拍摄您的手势,并查看模型的输出:

Your algorithm predicts: y = 3

尽管您可以看到算法似乎对其进行了错误分类,但您还是值得表扬。原因在于训练集不包含任何“竖起大拇指”手势,所以模型不知道如何处理它!我们称之为“不匹配的数据分布”,它是下一门课程“构建机器学习项目”将会研究的内容。

您应该记住的是:

Tensorflow是用于深度学习的编程框架

Tensorflow中的两个主要对象类是张量和操作符。

在tensorflow中编码时,您必须采取以下步骤:

创建一个包含张量(变量,占位符…)和操作(tf.matmul,tf.add,…)的图

创建一个会话

初始化会话

运行会话以执行图

您可以像在model()中看到的那样多次执行图

在“优化器”对象上运行会话时,会自动完成反向传播和优化。

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20180605G1OL6C00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券