TensorFlow实现简单神经网络分类问题

里克贝斯

发布于 2021-05-21 15:44:00

1K0

发布于 2021-05-21 15:44:00

文章被收录于专栏：图灵技术域图灵技术域

利用TensorFlow来训练所有的神经网络的训练过程可以分为如下3个步骤：

①定义神经网络的结构和前向传播的输出结果。

②定义损失函数以及选择反向传播优化算法。

③生成会话（tf.Session）并且在训练数据上反复运行反向传播优化算法。

下面给出一个简单的二分类问题的神经网络算法（完整的流程）

神经网络具体结构如下图：

训练流程图：

几个解释：

①Numpy 是一个科学计算的工具箱的，这里通过Numpy生成模拟数据集。

②batch是每一次的训练数据的大小。

③损失函数是交叉熵（cross_entropy）

具体解释请看：https://www.omegaxyz.com/2018/05/07/information_entropy/

④反向传播算法可以使用梯度下降法：tf.train.GradientDescentOptimizer(0.05).minimize(cross_entropy)或者tf.train.AdamOptimizer(0.002).minimize(cross_entropy)

文章中使用的是AdamOptimizer，学习率是0.002。

⑤这里所有x1+x2<1的样例都被认为是正样本。

⑥每隔一段时间计算在所有数据上的交叉熵并输出，交叉熵越小说明预测的结果和真实的结果差距越小，这里用matplotlib画图。

代码：

Python

import tensorflow as tf
import matplotlib.pyplot as plt
from numpy.random import RandomState
# Numpy 是一个科学计算的工具箱的，这里通过Numpy生成模拟数据集
 
# 定义训练数据batch的大小
batch_size = 8
 
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
 
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
 
# 定义神经网络前向传播过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
 
# 定义损失函数和反向传播算法
cross_entropy = -tf.reduce_mean(
    y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.002).minimize(cross_entropy)
# 采用梯度下降优化器进行优化
# train_step = tf.train.GradientDescentOptimizer(0.05).minimize(cross_entropy)
 
 
# 通过随机数生成一个模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
 
# 产生样本标签，这里所有x1+x2<1的样例都被认为是正样本
Y = [[int(x1 + x2 < 1)] for (x1, x2) in X]
 
# 创建一个会话来运行tensorflow程序
with tf.Session() as sess:
    init_op = tf.initialize_all_variables()
    sess.run(init_op)
    print(sess.run(w1))
    print(sess.run(w2))
 
    STEPS = 5000
 
    plt.axis([0, 5000, 0, 0.08])
    plt.ion()
    x11 = [0, 0]
    y11 = [1, 1]
 
    for i in range(STEPS):
        start = (i * batch_size) % dataset_size
        end = min(start + batch_size, dataset_size)
        # 通过选取的样本训练神经网络并更新参数
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
        if i % 100 == 0:
            # 每隔一段时间计算在所有数据上的交叉熵并输出，交叉熵越小说明预测的结果和真实的结果差距越小
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
            print("After %d training step,cross entropy on all data is %g" % (i, total_cross_entropy))
            x11[0] = x11[1]
            y11[0] = y11[1]
            x11[1] = i
            y11[1] = total_cross_entropy
            plt.plot(x11, y11)
            plt.xlabel("Step")
            plt.ylabel("Cross Entropy")
            plt.pause(0.05)
        # print(sess.run(w1))
        # print(sess.run(w2))
plt.pause(10)

结果：

交叉熵越低，结果越好

本文参与腾讯云自媒体分享计划，分享自作者个人站点/博客。

原始发表：2018-05-31，如有侵权请联系 cloudcommunity@tencent.com 删除

神经网络

编程算法

numpy

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

神经网络

编程算法

numpy

登录后参与评论

0 条评论

热度