Keras从多个输出的多个损失中寻找最佳损失以进行反向传播

、、

我在keras中使用多输出模型来解决一个回归问题。例如，模型如下： model = Model(inp, [out1, out2, out3]) 我想要计算每个输出的损失，但基于每个损失，选择一个并仅通过它反向传播，并使每个其他权重为0。这就像一种损失，在所有损失中找到最好的损失和输出，并只从该输出中学习。例如，out 1<e

浏览 13提问于2019-02-26得票数 1

1回答

如何计算损失函数？

、、、、

我希望你做得好，我想问一个关于神经网络中损失函数的问题。我知道，对训练集中的每个数据点计算损失函数，然后根据是否使用批处理梯度下降(在所有数据点通过后进行反向传播)、小批处理梯度下降(批处理后进行反向传播)或随机梯度下降(在每个数据点之后进行反向传播)进行反向传播现在让我们来看看MSE

浏览 0提问于2022-05-25得票数 1

回答已采纳

1回答

我正试图预测一维行波(正方形、三角形和锯齿形)的未来状态，使用Keras的深度学习设置。波在1024个数据点中被离散化。由于这为RNN提供了相当高的输入维数，所以使用卷积自编码装置将1024输入降为10维的低维潜伏空间。给出了RNN的5个前一时间步长的潜在输入来预测下一时间步长。我分别训练了自动编码器和RNN，取得了相当好的效果，但理想情况下可以改进。下面的图给出了我如何以解耦的方式训练模型的例子。我的

浏览 0提问于2018-12-10得票数 1

1回答

如何训练多输出深度学习模式？

、、、、

我想我不懂多输出网络。您可以看到这两个输出(aux_output和main_output)。反向传播是如何工作的？我的直觉是，模型做了两个反向传播，每个输出一个。然

浏览 2提问于2019-07-22得票数 8

回答已采纳

2回答

keras是如何处理多重损失的？

、、、

如果我有类似这样的东西：l2 = 0.3final_loss = l1*loss1 + l2*loss2 另外，在培训过程中，这意味着什么？loss2是否仅用于更新y2所在层的权重？或者它用于模型的所有层？

浏览 1提问于2018-03-21得票数 63

回答已采纳

1回答

TensorFlow / PyTorch:外部测量的损耗梯度

、、、、

我有一个系统，它由一个神经网络组成，它的输出被输入到一个未知的非线性函数F中，例如一些硬件。其思想是将神经网络训练为未知非线性函数F的逆F^(-1)，这意味着损失L是在F的输出处计算的，但是由于F的梯度不知道，反传播不能直接用于计算梯度和更新NN权值。在计算TensorFlow或PyTorch中的梯度时，是否可以使用没有直接连接到神经网络的<em

浏览 2提问于2020-01-16得票数 1

2回答

在多个损失核上训练具有单一输出的模型

、、、、

我正在使用keras构建一个图像分割模型，并希望在多个损失函数上训练我的模型。我已经看到链接，但我正在为这种情况寻找一个更简单和直接的解决方案，因为我的损失函数相当复杂。谁能告诉我如何在keras中建立一个具有多个损失的单输出模型。

浏览 13提问于2019-11-04得票数 0

回答已采纳

1回答

用于在Keras中初始化LSTM单元状态的MLP

、、

我们可以使用MLP的输出作为LSTM网络中的小区状态，并使用反向传播来训练MLP吗？这类似于使用CNN & LSTM的图像字幕，其中CNN的输出被展平并用作初始隐藏/单元状态，并训练堆叠网络，其中甚至CNN部分也通过反向传播进行更新。我在keras中尝试了一个架构来实现同样的效果。但是MLP的</em

浏览 1提问于2018-07-19得票数 1

2回答

Keras如何处理多个输出中的反向传播

、、

对于这样的网络架构：input1--->| CNN | -------|input3--->| CNN | --------| Aux_out反向传播流程是如何进行的我的意思是，有两个反向传播步骤？或者来自Main_out的</em

浏览 62提问于2019-07-26得票数 1

1回答

LSTM:时间序列预测:多对一，多对多。

、、、、

我试着用LSTM预测物体的轨迹。我脑海中有三种不同的训练和预测价值观的配置，我想知道解决这个问题的最佳方法是什么(我也希望对这些方法有深刻的见解)。1)多对一(损失是单个值的最小均方)损失函数是预测值及其实数的最小均方误差(因此，对应于位置n+1中的值)。在在线测试

浏览 0提问于2020-03-27得票数 3

1回答

Keras使用y_preds和y_true而不是X_train训练模型

、

我想使用model.fit方法在Keras中训练我的模型。据我所知，首先，它采用输入X_train，进行预测，然后将其与y_train进行比较，以计算损失和反向传播。

浏览 2提问于2018-03-30得票数 0

1回答

pytorch:第二批处理的loss.backward内存不足

、

我正在学习使用https://github.com/keon/seq2seq的seq2seq模型。我已经成功地运行了原始项目。然后，我想训练自己的翻译模型。对于我自己的数据，下面的代码是OK的。optimizer.step() torch.cuda.empty_cache() 对于batch size = 16，上述代码对于第一批是OK的，对于第二批是在loss.backward中报告<

浏览 378提问于2021-05-02得票数 0

1回答

Keras:在优化具有多个输出层的网络时，损失是如何评估的？

、

我在Keras中使用functional API来构建一个具有多个输出层的神经网络模型。我想知道在优化过程中更新权重时(当做back-prop时)损失是如何评估的。假设使用相同的损失函数，那么所有输出的平均损失是用于最小化成本函数还是单独评估每个输出以更新权重？提前感谢！

浏览 0提问于2017-04-29得票数 3

1回答

Caffe:如果两层反向支持梯度到相同的底部斑点，会发生什么？

、、、、

我想知道，如果我有一个层生成一个底部斑点，并被两个后续层进一步消耗，这两个层都将在后向传播阶段生成一些梯度来填充bottom.diff。是否将两个梯度相加以形成最终的梯度？或者，他们中只有一个人能活下来？在我的理解中，咖啡层需要在填充一些计算出的梯度之前将bottom.diff设置为全零，对吗？memset会刷新另一层已经计算出的渐变吗？谢谢!

浏览 0提问于2017-06-07得票数 2

1回答

时间损失、平均绝对误差和验证损失是机器学习时间序列天气预报的"nan“。

、、、

对于链接中给定的数据集，计算出的所有损失(即损失、平均绝对误差、验证损失、验证的平均绝对误差；后两个损失不是所有历元模型的损失)都是非零的，而当我更改数据集时，所有损失值都是nan。与这里使用的数据集相比，我使用的数据集有大约一半的读数。我的数据集有从多个位置(40多

浏览 9提问于2022-11-01得票数 0

回答已采纳

2回答

变分式自动编码器从译码器输入到编码器输出的反向传播

、、、

我试图深入了解VAE，通过自己来实现它，当将解码器输入层的损耗反向传播到编码器输出层时会遇到困难。decoder_in = sigma * N(0,I) + mu 然后对解码器网络进行前向传播，计算MSE重构损失和反向传播权值，并计算到译码器输入层的

浏览 4提问于2020-08-05得票数 6

回答已采纳

1回答

Caffe如何更新具有多个输出分支的斑点的渐变？

、、、、

Caffe支持多损失。然后，对于反向传播阶段，一些斑点可能具有来自不同损失的多个梯度。Caffe如何处理这个斑点的渐变？ 

浏览 0提问于2017-12-14得票数 1

2回答

class_weight与loss_weights在Keras中的差异

、

Keras的参数class_weight用于fit()函数，loss_weights用于compile()函数。从解释(文档)和我所理解的情况来看，两者似乎是相同的，因为它们被用来表示每个类的重要性。

浏览 0提问于2019-12-11得票数 5

2回答

将一个列表作为loss_weights传递，它应该有每个模型输出的一个条目。Keras告诉我，模型有一个输出，但我认为有更多的输出。

、、、、

我有一个多类分类问题的dataset df。我有一个巨大的阶级失衡。即grade_F和grade_G。，就像我们看到的一样。我有一个输出维数为7的神经网络。因此，我尝试了以下神经网络：from keras.layers import Dense, Dropout from keras.constraintslossWeights = df['grade'].v

浏览 3提问于2019-09-17得票数 0

回答已采纳

1回答

当可能发生多个操作时，策略梯度是多少？

、

卡帕的例子只有上下两个动作，所以一个输出神经元就足够了(高activation=UP，低activation=DOWN)。我想把它扩展到多个动作，所以我相信我需要输出层上的softmax激活函数。但是，我不确定输出层的梯度应该是多少。如果我在监督学习环境中使用具有softmax激活的交叉熵损失函数，神经元的梯度就是：其中target[i] = 1用于所需的</

浏览 6提问于2017-05-10得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何计算损失函数？

训练多个角点模型并组合输出以确定损失

如何训练多输出深度学习模式？

keras是如何处理多重损失的？

TensorFlow / PyTorch:外部测量的损耗梯度

在多个损失核上训练具有单一输出的模型

用于在Keras中初始化LSTM单元状态的MLP

Keras如何处理多个输出中的反向传播

LSTM:时间序列预测:多对一，多对多。

Keras使用y_preds和y_true而不是X_train训练模型

pytorch:第二批处理的loss.backward内存不足

Keras:在优化具有多个输出层的网络时，损失是如何评估的？

Caffe:如果两层反向支持梯度到相同的底部斑点，会发生什么？

时间损失、平均绝对误差和验证损失是机器学习时间序列天气预报的"nan“。

变分式自动编码器从译码器输入到编码器输出的反向传播

Caffe如何更新具有多个输出分支的斑点的渐变？

class_weight与loss_weights在Keras中的差异

将一个列表作为loss_weights传递，它应该有每个模型输出的一个条目。Keras告诉我，模型有一个输出，但我认为有更多的输出。

当可能发生多个操作时，策略梯度是多少？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐