前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TensorFlow实现深层神经网络

TensorFlow实现深层神经网络

作者头像
SimpleAstronaut
发布2022-08-09 09:39:42
3290
发布2022-08-09 09:39:42
举报
文章被收录于专栏:LMC的摸鱼博客LMC的摸鱼博客

Post Views: 310

介绍

深度神经网络(Deep Neural Networks,DNN)可以理解为有很多隐藏层的神经网络,又被称为深度前馈网络,多层感知机。

本实验介绍深层神经网络在 TensorFlow 上的实现,并使用模型处理 MNIST 数据集。

理论知识回顾

一个两层的深层神经网络结构如下:

image
image
  1. 上图所示的是一个具有两层隐藏层的深层神经网络
  2. 第一个隐藏层有 4 个节点,对应的激活函数为 ReLu 函数
  3. 第一个隐藏层有 2 个节点,对应的激活函数也是 Relu 函数
  4. 最后,输出层使用 softmax 函数作为激活函数
MNIST 数据集介绍

MNIST 是一个手写阿拉伯数字的数据集。

其中包含有 60000 个已经标注了的训练集,还有 10000 个用于测试的测试集。

MNIST包含四个文件案,分别为

名称

t10k-images-idx3-ubyte.gz

t10k-labels-idx1-ubyte.gz

train-images-idx3-ubyte.gz

train-labels-idx1-ubyte.gz

模型设计
  1. MNIST 数据一共有 784 个输入,所以我们需要一个有 784 个节点的输入层。
  2. MNIST 数据使用 One-Hot 格式输出,有 0-9 10 个 label,分别对应是否为数字 0-9,所以我们在输出层有 10 个节点,由于 0-9 的概率是互斥的,我们使用 Softmax 函数作为该层的激活函数。

不一样 的是我们可以通过调整深度神经网络的层次来看看能不能达到不一样的效果。

下载训练集

使用以下的命令进行下载:

下载 train-images-idx3-ubyte.gz( 训练集图片,55000张训练集,5000张验证集 )

代码语言:javascript
复制
wget http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz

下载 train-labels-idx1-ubyte.gz( 训练集图片对应的标签 )

代码语言:javascript
复制
wget http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
下载测试集

下载 t10k-images-idx3-ubyte.gz( 测试集图片,10000张图片 )

代码语言:javascript
复制
wget http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz

下载 t10k-labels-idx1-ubyte.gz( 测试集图片对应的标签 )

代码语言:javascript
复制
wget http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
创建代码

现在您可以在 /home/ubuntu 目录下创建源文件 deep_neural_networks.py

代码语言:javascript
复制
touch deep_neural_networks.py
编辑代码

编辑 deep_neural_networks.py ,内容可参考:

deep_neural_networks.py

代码语言:javascript
复制
import numpy as np
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
​
def add_layer(inputs, in_size, out_size, activation_function=None):
    W = tf.Variable(tf.random_normal([in_size, out_size]))
    b = tf.Variable(tf.zeros([1, out_size]) + 0.01)
​
    Z = tf.matmul(inputs, W) + b
    if activation_function is None:
        outputs = Z
    else:
        outputs = activation_function(Z)
​
    return outputs
​
​
if __name__ == "__main__":
​
    MNIST = input_data.read_data_sets("mnist", one_hot=True)
​
    learning_rate = 0.01
    batch_size = 128
    n_epochs = 70
​
    X = tf.placeholder(tf.float32, [batch_size, 784])
    Y = tf.placeholder(tf.float32, [batch_size, 10])
​
    layer_dims = [784, 500, 500, 10]
    layer_count = len(layer_dims)-1 
    layer_iter = X
​
    for l in range(1, layer_count): # layer [1,layer_count-1] is hidden layer
        layer_iter = add_layer(layer_iter, layer_dims[l-1], layer_dims[l], activation_function=tf.nn.relu)
    prediction = add_layer(layer_iter, layer_dims[layer_count-1], layer_dims[layer_count], activation_function=None)
​
    entropy = tf.nn.softmax_cross_entropy_with_logits(labels=Y, logits=prediction)
    loss = tf.reduce_mean(entropy)
​
    optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)
​
    init = tf.initialize_all_variables()
​
    with tf.Session() as sess:
        sess.run(init)
​
        n_batches = int(MNIST.test.num_examples/batch_size)
        for i in range(n_epochs):
            for j in range(n_batches):
                X_batch, Y_batch = MNIST.train.next_batch(batch_size)
                _, loss_ = sess.run([optimizer, loss], feed_dict={X: X_batch, Y: Y_batch})
                if i % 10 == 5 and j == 0:
                    print "Loss of epochs[{0}]: {1}".format(i, loss_)
​
        # test the model
        n_batches = int(MNIST.test.num_examples/batch_size)
        total_correct_preds = 0
        for i in range(n_batches):
            X_batch, Y_batch = MNIST.test.next_batch(batch_size)
            preds = sess.run(prediction, feed_dict={X: X_batch, Y: Y_batch})
            correct_preds = tf.equal(tf.argmax(preds, 1), tf.argmax(Y_batch, 1))
            accuracy = tf.reduce_sum(tf.cast(correct_preds, tf.float32)) 
​
            total_correct_preds += sess.run(accuracy)
​
        print "Accuracy {0}".format(total_correct_preds/MNIST.test.num_examples)
代码讲解
add_layer 函数

允许用户指定上一层的输出节点的个数作为 input_size,本层的节点个数作为 output_size,并指定激活函数 activation_function 可以看到我们调用的时候位神经网络添加了两个 隐藏层输出层

代码语言:javascript
复制
for l in range(1, layer_count): # layer [1,layer_count-1] is hidden layer
    layer_iter = add_layer(layer_iter, layer_dims[l-1], layer_dims[l], activation_function=tf.nn.relu)
prediction = add_layer(layer_iter, layer_dims[layer_count-1], layer_dims[layer_count], activation_function=None)
​
entropy = tf.nn.softmax_cross_entropy_with_logits(labels=Y, logits=prediction)
loss = tf.reduce_mean(entropy)
神经网络配置

注意这一行,我们配置了一个深度的神经网络,它包含两个隐藏层,一个输入层和一个输出层 隐藏层的节点数为 500

代码语言:javascript
复制
layer_dims = [784, 500, 500, 10]
执行代码
代码语言:javascript
复制
python deep_neural_networks.py

运行过程中,如果出现网络错误,请重试。

运行输出:

代码语言:javascript
复制
Loss of epochs[5]: 19.5915279388
Loss of epochs[15]: 7.20698690414
...
Loss of epochs[65]: 0.24952724576
Accuracy 0.939

可以看到经过 70 轮的训练,准确度大约在 94%左右

探索(play around)
代码语言:javascript
复制
你可以通过修改下面的这个代码片段来修改整个神经网络。

deep_neural_networks.py

代码语言:javascript
复制
    layer_dims = [784, 500, 500, 10]

比如你可以去掉一层隐藏层,并将隐藏层的节点数改为 600

deep_neural_networks.py

代码语言:javascript
复制
    layer_dims = [784, 600, 10]

训练完的结果大概是这样:

代码语言:javascript
复制
Loss of epochs[5]: 13.1280488968
Loss of epochs[15]: 9.14239501953
Loss of epochs[25]: 3.60039186478
...
Loss of epochs[65]: 3.32054066658
Accuracy 0.9161

准确度大概 92% 的样子。have fun!

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021年12月19日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 介绍
    • 理论知识回顾
      • MNIST 数据集介绍
        • 模型设计
          • 下载训练集
            • 下载测试集
              • 创建代码
                • 编辑代码
                  • 代码讲解
                    • add_layer 函数
                      • 神经网络配置
                        • 执行代码
                          • 探索(play around)
                          领券
                          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档