这是我第一次写一个基于Pytorch的CNN。我终于让代码运行到了为第一批数据生成输出的地步,但在第二批数据中生成了nans。出于调试目的,我极大地简化了模型,但它仍然不能正常工作。这里显示的模型只是几个具有线性输出的完全连接的层。 我猜问题出在反向传播这一步,但我不清楚问题出在哪里,为什么。 以下是模型的一个非常简化的版本,它仍然会产生错误: 数据加载器: batch_size = 36# note "rollaxis" to move channel from last to first dimension
# X_tra