# 学习笔记CB009:人工神经网络模型、手写数字识别、多层卷积网络、词向量、word2vec

`# coding:utf-8`
`import sys`
`import importlib`
`importlib.reload(sys)`
`from tensorflow.examples.tutorials.mnist import input_data`
`import tensorflow as tf`
`flags = tf.app.flags`
`FLAGS = flags.FLAGS`
`flags.DEFINE_string('data_dir', './', 'Directory for storing data')`
`mnist = input_data.read_data_sets(FLAGS.data_dir, one_hot=True)`
`# 初始化生成随机的权重(变量)，避免神经元输出恒为0`
`def weight_variable(shape):`
`    # 以正态分布生成随机值`
`    initial = tf.truncated_normal(shape, stddev=0.1)`
`    return tf.Variable(initial)`
`# 初始化生成随机的偏置项(常量)，避免神经元输出恒为0`
`def bias_variable(shape):`
`    initial = tf.constant(0.1, shape=shape)`
`    return tf.Variable(initial)`
`# 卷积采用1步长，0边距，保证输入输出大小相同`
`def conv2d(x, W):`
`    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')`
`# 池化采用2×2模板`
`def max_pool_2x2(x):`
`    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1],`
`        strides=[1, 2, 2, 1], padding='SAME')`
`# 28*28=784`
`x = tf.placeholder(tf.float32, [None, 784])`
`# 输出类别共10个：0-9`
`y_ = tf.placeholder("float", [None,10])`
`# 第一层卷积权重，视野是5*5，输入通道1个，输出通道32个`
`W_conv1 = weight_variable([5, 5, 1, 32])`
`# 第一层卷积偏置项有32个`
`b_conv1 = bias_variable([32])`
`# 把x变成4d向量，第二维和第三维是图像尺寸，第四维是颜色通道数1`
`x_image = tf.reshape(x, [-1,28,28,1])`
`h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)`
`h_pool1 = max_pool_2x2(h_conv1)`
`# 第二层卷积权重，视野是5*5，输入通道32个，输出通道64个`
`W_conv2 = weight_variable([5, 5, 32, 64])`
`# 第二层卷积偏置项有64个`
`b_conv2 = bias_variable([64])`
`h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)`
`h_pool2 = max_pool_2x2(h_conv2)`
`# 第二层池化后尺寸编程7*7，第三层是全连接，输入是64个通道，输出是1024个神经元`
`W_fc1 = weight_variable([7 * 7 * 64, 1024])`
`# 第三层全连接偏置项有1024个`
`b_fc1 = bias_variable([1024])`
`h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])`
`h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)`
`# 按float做dropout，以减少过拟合`
`keep_prob = tf.placeholder("float")`
`h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)`
`# 最后的softmax层生成10种分类`
`W_fc2 = weight_variable([1024, 10])`
`b_fc2 = bias_variable([10])`
`y_conv=tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)`
`cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv))`
`# Adam优化器来做梯度最速下降`
`train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)`
`correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1))`
`accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))`
`sess = tf.InteractiveSession()`
`sess.run(tf.global_variables_initializer())`
`for i in range(20000):`
`    batch = mnist.train.next_batch(50)`
`    if i%100 == 0:`
`        train_accuracy = accuracy.eval(feed_dict={`
`            x:batch[0], y_: batch[1], keep_prob: 1.0})`
`        print("step %d, training accuracy %g"%(i, train_accuracy))`
`    train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})`
`print("test accuracy %g"%accuracy.eval(feed_dict={`
`    x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0}))`

word embedding，词嵌入，范畴论，morphism(态射)，态射表示两个数学结构中保持结构过程抽象，一个域和另一个域之间关系。范畴论中嵌入(态射)保持结构，word embedding表示“降维”嵌入，通过降维避免维度灾难，降低计算复杂度，更易于深度学习应用。

word2vec本质，通过distributed representation表达方式表示词，通过降维word embedding减少计算量。

word2vec训练神经概率语言模型。word2vec CBOW和Skip-gram模型。CBOW模型。Continuous Bag-of-Words Model，已知当前词上下文预测当前词。CBOW模型神经网络结构，输入层，词w上下文2c个词的词向量。投影层，输入层2c个向量做求和累加。输出层，霍夫曼树，叶子节点是语料出现过词，权重是出现次数。神经网络模型首尾相接改成求和累加，减少维度。去掉隐藏层，减少计算量。输出层softmax归一化运算改成霍夫曼树。

word2vec，下载源码，https://github.com/warmheartli/ChatBotCourse/tree/master/word2vec)，执行make编译(mac系统代码所有#include <malloc.h>替换成#include <sys/malloc.h>)。编译生成word2vec、word2phrase、word-analogy、distance、compute-accuracy二进制文件。训练，语料，已切好词(空格分隔)文本。执行 ./word2vec -train train.txt -output vectors.bin -cbow 0 -size 200 -window 5 -negative 0 -hs 1 -sample 1e-3 -thread 12 -binary 1 。生成vectors.bin文件，训练好词向量二进制文件，求近义词了，执行 ./distance vectors.bin 。

《Python 自然语言处理》

http://www.shareditor.com/blogshow?blogId=92

http://www.shareditor.com/blogshow?blogId=97

http://www.shareditor.com/blogshow?blogId=99

http://www.shareditor.com/blogshow?blogId=100

0 条评论

• ### 学习笔记TF063:TensorFlow Debugger

TensorFlow Debugger(tfdbg)，TensorFlow专用调试器。用断点、计算机图形化展现实时数据流，可视化运行TensorFlow图形内部...

• ### 学习笔记TF060:图像语音结合，看图说话

实现人工智能3要素：语法(syntax)、语义(semantics)、推理(inference)。语言、视觉。通过语法(语言语法解析、视觉三维结构解析)和语义(...

• ### 学习笔记CB013: TensorFlow、TensorBoard、seq2seq

tensorflow基于图结构深度学习框架，内部通过session实现图和计算内核交互。

• ### 关于模型压缩，近一个月从模型精简，硬件实现，到模型剪枝

精简模型的设计是模型压缩中的第一步，而且是能够保证模型精度不下降的最有效的一种策略，最近我们分享了对特征图的冗余计算进行约减的GhostNet框架。

• ### [DeeplearningAI笔记]目标定位/特征点检测/目标检测/滑动窗口的卷积神经网络实现/YOLO算法

的特征图.将结果输入到两层具有 400 个神经元节点的全连接层中，然后使用 softmax 函数进行分类--表示 softmax 单元输出的 4 个分类出现的...

• ### CTR学习笔记&代码实现4-深度ctr模型 NFM/AFM

这一节我们总结FM另外两个远亲NFM，AFM。NFM和AFM都是针对Wide&Deep 中Deep部分的改造。上一章PNN用到了向量内积外积来提取特征交互信息，...

• ### 美国突然宣布「净网」措施：禁止中国App、BAT云服务、电信运营商等

在美国总统唐纳德 · 特朗普威胁要禁止 TikTok 之后， 8 月 5 日（周三），美国国务卿迈克 · 庞培（Mike Pompeo）召开记者会，宣布了一项旨...

• ### 肖健雄的无人车公司AutoX，现在要在美国配送生鲜了

还记得他之前喊出的“让天下没有难开的店”吗？这个把自动驾驶和新零售放到一起，来商业化落地无人车的知名华人AI创业者，现在先让美国加州人民享受“无人配送生鲜”服务...

• ### ActiveMQ 服务器的部署

ActiveMQ 是 Apache 流行、强大的开源消息传递和集成模式服务器，它完全支持 JMS 1.1(严格实现“点对点”和“发布/订阅”两种消息模型) 和 ...