神经网络手写数字识别

文章来源：企鹅号 - RAIS

聊了几天理论，是该弄一个 Hello World 了，在人工智能领域，或者说深度学习领域，Hello World 程序就是手写数字识别，今天我们就来看看手写数字识别的程序怎么写。不愿意看代码吗，那我就说一说这段代码干了点什么：先通过 keras 内置的数据集下载测试数据，是 60000 长手写图片的训练集和 10000 张测试集，随后定义了一个神经网络的模型，设置网络中的层参数，随后配置训练网络的参数，包括损失函数和评测模型，设置迭代次数，启动训练网络，最后将测试数据喂给网络，得出训练效果是否有效。还是建议看仔细看一下代码：

TensorFlow 作为其运行引擎，输出数据集格式：

这是运行过程简图，可以看出准确率随着迭代次数，越来越高，训练后模型在测试集上运行识别准确率差不多为 98%：

这里我们思考几个问题：

这个网络真的好像一个黑盒子，给了一些训练数据，然后就得出了一个模型，但是这个训练过程中，究竟向量间是怎么运算的，究竟特征值是怎么取的，每次运算的结果还不一样，那是不是就没有办法分析这个网络中究竟发生了什么，是不是觉得有点慌。如果一个人工智能指挥的战争，我们是不是都没有办法预测究竟发生了什么，指挥的命令是否符合人类最高价值观，想一想就会觉得有点可怕。

这个训练过程其实还是挺耗时的，或者说神经网络运行一般都是挺耗时的，因此这个问题怎么去处理，怎么去剪枝，让其可以在有限的时间内就可以得到可以接受的结果。这是不是就对 AlphaGo 有了一点不一样的理解。

这个网络究竟是怎么训练数据的，似乎也没写什么相关代码呀，好像也可以完成不少的事情，神经网络都这么简单吗？当然不是。在 network.fit 中最后最后一个参数是设置了callback，在控制台用 tensorboard --logdir=log 命令可以查看运行过程图，看不懂没关系，以后我们慢慢分析，截图如下：

今天，我们写了一个 Hello World，用的是 Keras，其底层内核是 TensorFlow，直观感性的复习一下之前聊过的知识，只看无益，去试一试吧！

发表于: 2020-01-072020-01-07 11:38:19
原文链接：https://kuaibao.qq.com/s/20200107A0A6S900?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

神经网络手写数字识别

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐