我正在尝试用TensorflowJS制作python版本的Tensorflow的相同示例。不幸的是,当我运行脚本时,我不知道为什么训练时记录的损失值是NaN。我想要实现的是一个简单的文本分类,它根据训练好的模型返回0或1。这是我正在关注的Python教程import * as tf from '@tensorflow/tf
我正在计算一个定制的成本函数,它简单地取交叉熵的指数除以参数\eta。在第一次迭代(大约20次)中,训练损失正在减少,但在那之后,我突然得到了一个nan,我不明白为什么会发生这种情况。我使用的代码如下:eta = 2 #just an example of value of eta I'm using
criterion = nn.CrossEntropyLoss
为了使用MSE计算损失,我使用人脸地标检测库生成预测图像的人脸标志。不幸的是,在早期,网络会产生混淆,而脸地标检测库返回None,而不是256 x 256 x 3格式的预期张量,其中像素值表示地标的存在。
我想做的是忽略计算损失时,没有发现脸。对于预测,让我们假设不可能为批处理中的3幅图像生成任何地标。我可以将不能生成人脸标记的预测张量设置为NaN值,而预