文章/答案/技术大牛

发布

机器学习100天-Day12Tensorflow新手教程5

文章来源：企鹅号 - 一点点的ppt

github上的一个比较有意思的tensorflow教程，一共四大块：热身、基础、基础机器学习、基础神经网络。打算翻译一下搬运过来。

地址：https://github.com/osforscience/TensorFlow-Course/blob/master/codes/python/3-neural_networks/recurrent-neural-networks/code/rnn.py

这是之前Tensorflow新手教程的最后一课，博主基于Tensorflow完成了一个RNN，昨天的echo-RNN有不少不明白的地方，今天基于这个教程做了比较详细的注解，希望对初学者有一些帮助。

接下来会实现的是LSTM，针对机器学习100天内的模型使用Tensorflow进行复现。

本文参考的博客

https://zhuanlan.zhihu.com/p/28196873

https://blog.csdn.net/lenbow/article/details/52181159

https://blog.csdn.net/UESTC_C2_403/article/details/73187915

引入库

tensorflow警告记录，可以避免在运行文件时出现红色警告

argparse是python用于解析命令行参数和选项的标准模块，用于代替已经过时的optparse模块。argparse模块的作用是用于解析命令行参数。

我们很多时候，需要用到解析命令行参数的程序。

当运行参数不正确需要调用时会打印出描述信息，本例中为“Creating Classifier”

优化标记

学习速率:0.001

seed:111

训练标记

batch_size（批尺寸）:128

num_epoch（全数据集迭代次数）:10

batch_per_log:10

Batch_Size（批尺寸）是机器学习中一个重要参数。

Batch决定的是下降的方向。如果数据集比较小，可以采用全数据集（full batch learning）的形式。

这样做至少有 2 个好处：

全数据集确定的方向能够更好地代表样本总体，从而更准确地朝向极值所在的方向。

由于不同权重的梯度值差别巨大，因此选取一个全局的学习率很困难。Full Batch Learning 可以使用 Rprop 只基于梯度符号并且针对性单独更新各权值。

但是面对更大的数据集，载入数据和梯度修正值都会是问题

所以要在合理的范围内增大batch_size，能够更有效利用内存、提高数据完整性

num_epoch（全数据集迭代次数）

模型标记

隐藏层中神经元为128个

tf.app.flags可以认为是对模块argparse的简单封装，它实现了python-gflags的一个功能子集。

请注意，此模块目前封装在一起，主要用于编写演示应用程序，并且在技术上不是公共API的一部分，将来有发生更改的可能性。

建议您使用argparse或您喜欢的任何其他代码库实现自己的标志解析。

这里类似args可以调用之前存储的所有元素信息

args.seed

args = tf.app.flags.FLAGS

args.learning_rate

args.batch_size

args.hidden_size

args.seed

args.batch_per_log

args.num_epoch

在FLAG结构中存储所有元素

实现RNN

rnn_cell:是Tensorflow中实现RNN的基本单元。每个rnn_cell都有一个call方法。

每调用一次RNNCell的call方法，就相当于在时间上“推进了一步”。但是对于单个RNNCell调用call函数进行运算时，只是在序列时间上前进了一步。比如使用x1、h0得到h1，通过x2、h1得到h2等。

eg：如果序列长度为10，就要调用10次call函数，比较麻烦。

TensorFlow提供了一个tf.nn.dynamic_rnn函数，使用该函数就相当于调用了n次call函数。即通过直接得。

输入数据的格式为(batch_size, time_steps, input_size)

time_steps表示序列本身的长度，如在Char RNN中，长度为10的句子对应的time_steps就等于10。

input_size就表示输入数据单个序列单个时间维度上固有的长度。

X为上面初始化的占位符

已经定义好了一个RNNCell，调用该RNNCell的call函数time_steps次

最后得到的结果中有两个output和state

output就是time_steps步里所有的输出。形状为(batch_size, time_steps, cell.output_size)。

state是最后一步的隐状态，形状为(batch_size, cell.state_size)

前向传播和损失计算

优化和预测

数据处理

训练模型

发表于: 2019-01-012019-01-01 11:20:28
原文链接：https://kuaibao.qq.com/s/20190101A0DPEJ00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

机器学习100天-Day12Tensorflow新手教程5

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐