人工智能技术问答之三

图书销售以来读者交流群十分活跃,小编截取一部分问答共享给深度学习爱好者。

读者

老师,求一个序列数据的移动平均值的目的何在?

打印loss值。让loss值的可视化更加平滑。

代码医生

读者

32、64之间有什么关系吗?

32是输入,64是输出。

代码医生

读者

我知道32是输入,64时输出,但为什么一定是这两个数字呀?是不是科学家做实验发现的啊?

这个也不一定。主要看经验吧。而且这个值也不一定是最好。还是得多尝试。根据不同的样本特征,选择不同的比例,没有统一定律。

代码医生

读者

对于书中的mnistinfogan程序,如果不使用mnist数据集,而是直接使用方阵的话,需要怎么修改代码呀?不一定。主要看经验吧。而且这个值也不一定是最好。还是得多尝试。根据不同的样本特征,选择不同的比例,没有统一定律。

主要是看你的数据内容。行和列要跟模型输入的维度匹配。infogan主要是学习loss处理方面的知识。对于loss的计算没有做过多的技巧。直接方阵有可能会不收敛,这个跟具体的数据有关。发现不收敛了,可以看后面的章节会有很多比较好的训练方法。

代码医生

读者

请问这个问题怎么解决呀

tf.Session()

代码医生

读者

生成y的导数,到底是什么对于y的导数?而且最先求得不是应该是dL比上dy预测吗?再用dL比上w1,w2,b等等再来进行比如w = w-a*dl/dw等而且我觉得Del_y为输出层所需要的修改值这句话是我没理解清楚吗?因为修改值就意味着是α*dl/dw等这种形式,α是学习率,但这里明显不是啊?哪位大佬给解释下

如果看图理解不了,可以看代码。后面有个减法的代码。直接手动实现的反向推导。配合那个再理解就轻松了。见实例55:简单循环神经网络实现——裸写一个退位减法器

代码医生

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180421G0XU6X00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

同媒体快讯

扫码关注云+社区

领取腾讯云代金券