图书销售以来读者交流群十分活跃,小编截取一部分问答共享给深度学习爱好者。
读者
老师,求一个序列数据的移动平均值的目的何在?
打印loss值。让loss值的可视化更加平滑。
代码医生
读者
32、64之间有什么关系吗?
32是输入,64是输出。
代码医生
读者
我知道32是输入,64时输出,但为什么一定是这两个数字呀?是不是科学家做实验发现的啊?
这个也不一定。主要看经验吧。而且这个值也不一定是最好。还是得多尝试。根据不同的样本特征,选择不同的比例,没有统一定律。
代码医生
读者
对于书中的mnistinfogan程序,如果不使用mnist数据集,而是直接使用方阵的话,需要怎么修改代码呀?不一定。主要看经验吧。而且这个值也不一定是最好。还是得多尝试。根据不同的样本特征,选择不同的比例,没有统一定律。
主要是看你的数据内容。行和列要跟模型输入的维度匹配。infogan主要是学习loss处理方面的知识。对于loss的计算没有做过多的技巧。直接方阵有可能会不收敛,这个跟具体的数据有关。发现不收敛了,可以看后面的章节会有很多比较好的训练方法。
代码医生
读者
请问这个问题怎么解决呀
tf.Session()
代码医生
读者
生成y的导数,到底是什么对于y的导数?而且最先求得不是应该是dL比上dy预测吗?再用dL比上w1,w2,b等等再来进行比如w = w-a*dl/dw等而且我觉得Del_y为输出层所需要的修改值这句话是我没理解清楚吗?因为修改值就意味着是α*dl/dw等这种形式,α是学习率,但这里明显不是啊?哪位大佬给解释下
如果看图理解不了,可以看代码。后面有个减法的代码。直接手动实现的反向推导。配合那个再理解就轻松了。见实例55:简单循环神经网络实现——裸写一个退位减法器
代码医生