由于非常大的预测值，RNN损失变为NaN。

、、、、

下面是我使用Keras构建的RNN： model = Sequential()Epoch 1/3 : Batch 4/48 | loss = nan | root_mean_squared_error = nanEpoch 1/3 : Batch 5/48 | l

浏览 12提问于2016-09-03得票数 1

1回答

在拟合时，损失是NaN

、、、

我正在尝试用TensorflowJS制作python版本的Tensorflow的相同示例。不幸的是，当我运行脚本时，我不知道为什么训练时记录的损失值是NaN。我想要实现的是一个简单的文本分类，它根据训练好的模型返回0或1。这是我正在关注的Python教程import * as tf from '@tensorflow/tf

浏览 1提问于2018-08-27得票数 2

7回答

汇总直方图中的Nan

、、、

我的程序有时会遇到这个问题(并不是每次运行都会遇到这个问题)，如果遇到这个问题，我总是可以在程序崩溃之前由于nan而保存的最后一个模型中重现这个错误。当从该模型重新运行时，使用该模型生成损失的第一个训练过程似乎没有问题(我已经打印了损失，显示没有问题)，但在应用梯度后，嵌入变量的值将变为Nan。那么，nan问题的根本原因是什么呢？困惑，因为不知道如何进一步调试，

浏览 7提问于2016-10-04得票数 9

1回答

Tensorflow的损失函数在将RNN更改为LSTM单元后返回NAN

、

我正在训练一个使用RNN模型来预测时间序列的模型。此模型经过训练后没有任何问题。)loss = tf.reduce_mean(tf.square(outputs更改为tf.contrib.rnn.BasicLSTMCell时，问题来了，速度和损失函数(MSE变量变为NAN)大大减慢。我最好的选择是MSE是不正

浏览 0提问于2018-05-23得票数 0

1回答

如何在pytorch中收集每个观察值的预测？

我正在尝试自己使用循环而不是nn.rnn模块来创建一个RNN。但我仍然想使用pytorch的backward进行反向传播。我们能不能只创建一个正态列表，并将其附加到每个预测中？或者这将不允许反向传播？

浏览 18提问于2020-03-10得票数 1

回答已采纳

1回答

火炬中损失函数的奇异行为

、、、、

我正在计算一个定制的成本函数，它简单地取交叉熵的指数除以参数\eta。在第一次迭代(大约20次)中，训练损失正在减少，但在那之后，我突然得到了一个nan，我不明白为什么会发生这种情况。我使用的代码如下：eta = 2 #just an example of value of eta I'm using criterion = nn.CrossEntropyLoss

浏览 1提问于2021-11-25得票数 1

回答已采纳

1回答

基于RNN LSTM的异常检测

、、、

我训练了一个RNN LSTM，目前我得到了一步领先的预测。请给我指出正确的方向。目前，

浏览 0提问于2018-04-24得票数 5

1回答

Tensorflow预测序列

、、、、

所以我的任务是预测序列。在时间t处有x，y，z值，这是浮动类型。我必须预测时间值为x，y，z的序列(t + 1)。y - y_pred))现在，我想用前面的10个值来预测第time: time + TIME_STEP ], y : Y

浏览 0提问于2018-12-01得票数 1

回答已采纳

3回答

我最初尝试用ps |fft|^2计算功率谱，而dB通过10 * log10(ps)计算，但是TensorFlow CTC损失函数产生nan值，而且优化器显然会将所有params更新为nan，因此我没有进一步使用它值得一提的是，光谱图并没有标准化，因为它只会使TensorFlow出于某种原因产生nan值。请有人解释一下为什么会发生这种情况。我有种感觉梯度正在消失。有什么建议要使用的首字母范围？将project_size设置为hidden_size 500

浏览 6提问于2016-07-14得票数 5

1回答

时间序列Keras LSTM回显而不是预测

、、

我正在尝试训练LSTM来预测给定最后8个值的时间序列中的下一个值。取而代之的是，网络在响应当前值而不是下一个值作为预测方面变得越来越好。这是我数据中的一个示例[0.01549889 0.0200023 0.01537059 0.01064907 0.00771096 0.00352831 0.00363095 0.004131330.01929664 0.02047702 0.02625061 0.

浏览 4提问于2018-07-20得票数 2

1回答

通过对损失曲线的分析来改进神经网络

、

我建立了一些基于LSTM的网络。我调整了参数。结果如图所示，并不令人印象深刻。

浏览 3提问于2021-12-10得票数 -1

1回答

为什么我的tensorflow模型输出在x年代之后变成NaN？

、、、

在85个历元后，我的模型的损失(一个余弦距离)(一个带3个层的神经网络)变成NaN。为什么会发生这种情况，我该如何解决呢？我的模型的输出也变成NaN。Loss : nan蓝色曲线是训练数据的损失，橙色曲线是验证数据的损失。动态rnn获取每个序列的长度(代码中

浏览 3提问于2018-06-26得票数 5

回答已采纳

1回答

即使被屏蔽，期望值中的NaN也会在权重矩阵中引入NaN

、、、

为什么对NaN期望值的训练步骤被loss_0_where_nan掩盖(历史记录表明损失确实被评估为0.0)，仍然在hidden和max_min_pred的权重矩阵中引入NaN权重？首先，我认为这可能是单个参数学习与输出值的某种权重，我认为这可能是特定于Adadelta优化器的。但这也会发生在SGD上。][nan]][[-3.2140317][-2.22139478]][1 1][nan</e

浏览 0提问于2018-08-31得票数 3

1回答

在三重态损失中增加alpha有什么缺点吗？

、、

我想做一个通用的特征提取器，它也可以将一个新的类分类为模型中的未知类。除了基于距离的矩阵之外，还有什么好的技术可用吗？目前我使用的是Triplet loss，其中由于alpha值较小，我的Triplet训练损失在某些点上变为+0.00000。那么，将alpha增加到非常大的数量(如100 )有什么缺点吗？

浏览 19提问于2020-01-25得票数 0

1回答

如果损失变成了南，会发生什么？

在我的训练中，损失有时会变成nan。然而，这似乎并没有影响我的神经网络训练。有人知道tensorflow是否有一些nan值的内部处理吗？有没有人有过类似的经历？我用的是tensorflow 0.12.1

浏览 2提问于2017-03-01得票数 2

回答已采纳

1回答

训练多个角点模型并组合输出以确定损失

、、、

我正试图预测一维行波(正方形、三角形和锯齿形)的未来状态，使用Keras的深度学习设置。波在1024个数据点中被离散化。由于这为RNN提供了相当高的输入维数，所以使用卷积自编码装置将1024输入降为10维的低维潜伏空间。给出了RNN的5个前一时间步长的潜在输入来预测下一时间步长。我分别训练了自动编码器和RNN，取得了相当好的效果，但理想情况下可以改进。下面的图给出

浏览 0提问于2018-12-10得票数 1

1回答

Keras有状态LSTM返回验证损失的NaN。

、、

我在解释我的模型的训练和验证损失、敏感性和特异性时遇到了一些困难。我的验证敏感性、特异性和丢失性是NaN，我正在尝试诊断原因。由于我的类高度不平衡，我还使用了Keras的class_weights函数。(下一步的多标签预测)编写了这个模型：培训和验证指标以及损失不会随时代而变化，这是令人担忧的(我认为，这也是过度适应的症状)，但我也关心理解图形本身。以下是Ten

浏览 0提问于2018-02-03得票数 1

1回答

Tensorflow:我的rnn总是输出相同的值，rnn的权重没有经过训练。

、

我使用tensorflow实现了一个简单的RNN模型，以了解时间序列数据的可能趋势并预测未来值。然而，模型在训练后总是产生相同的值。实际上，它得到的最好的模型是：输入是连续几天中的一系列数据。输出是输入日之后的数据。 (也许这些不是很好的设置。但无论我如何改变它们，结果几乎是一样的。因此，我只是设置这些，以帮助

浏览 0提问于2019-03-15得票数 3

1回答

如何排除PyTorch中某些张量的损失计算？

、

为了使用MSE计算损失，我使用人脸地标检测库生成预测图像的人脸标志。不幸的是，在早期，网络会产生混淆，而脸地标检测库返回None，而不是256 x 256 x 3格式的预期张量，其中像素值表示地标的存在。我想做的是忽略计算损失时，没有发现脸。对于预测，让我们假设不可能为批处理中的3幅图像生成任何地标。我可以将不能生成人脸标记的预测张量设置为NaN值，而预

浏览 3提问于2022-06-26得票数 0

回答已采纳

2回答

在keras RNN中作为nan输出的损失

、、

从RNN的第一个时代起，损失值被输出为nan。历元1/100 9787/9787 ============================== - 22s 2ms/步进损耗: nan我的RNN</

浏览 0提问于2020-01-25得票数 6

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在拟合时，损失是NaN

汇总直方图中的Nan

Tensorflow的损失函数在将RNN更改为LSTM单元后返回NAN

如何在pytorch中收集每个观察值的预测？

火炬中损失函数的奇异行为

基于RNN LSTM的异常检测

Tensorflow预测序列

基于TensorFlow的端部语音识别神经网络

时间序列Keras LSTM回显而不是预测

通过对损失曲线的分析来改进神经网络

为什么我的tensorflow模型输出在x年代之后变成NaN？

即使被屏蔽，期望值中的NaN也会在权重矩阵中引入NaN

在三重态损失中增加alpha有什么缺点吗？

如果损失变成了南，会发生什么？

训练多个角点模型并组合输出以确定损失

Keras有状态LSTM返回验证损失的NaN。

Tensorflow:我的rnn总是输出相同的值，rnn的权重没有经过训练。

如何排除PyTorch中某些张量的损失计算？

在keras RNN中作为nan输出的损失

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐