Tensorflow中的LSTM反向传播

文章/答案/技术大牛

发布

1回答

具有Tensorflow或Theano的循环计算图

tensorflow、theano、lstm、recurrent-neural-network

TensorFlow和Theano似乎都不支持循环计算图，循环单元被实现为具有缓冲和展开的递归单元(RNN / LSTM单元)，但这种限制主要与反向传播的计算有关。我不需要计算反向传播，而只是前向传播。是否有一种方法可以忽略这一限制，或者仅仅是分解非循环组件中的任意计算图？

浏览 1提问于2016-05-31得票数 2

2回答

Tensorflow中的反向传播(穿越时间)代码

python、tensorflow、backpropagation

在哪里可以找到Tensorflow (python )中的反向传播(通过时间)代码？还是使用了其他算法？例如，当我创建一个LSTM网络时。

浏览 1提问于2016-04-20得票数 4

回答已采纳

4回答

在LSTM中“截断梯度”是什么意思？

tensorflow、recurrent-neural-network、lstm

我正在学习关于LSTM：的tensorflow教程。这一节说代码使用“截断反向传播”，那么这到底意味着什么呢？

浏览 9提问于2016-08-01得票数 4

回答已采纳

1回答

用于在Keras中初始化LSTM单元状态的MLP

tensorflow、keras、deep-learning

我们可以使用MLP的输出作为LSTM网络中的小区状态，并使用反向传播来训练MLP吗？这类似于使用CNN & LSTM的图像字幕，其中CNN的输出被展平并用作初始隐藏/单元状态，并训练堆叠网络，其中甚至CNN部分也通过反向传播进行更新。我在keras中尝试了一个架构来实现同样的效果。但是MLP的权重没有更新。我知道这在t

浏览 1提问于2018-07-19得票数 1

1回答

LSTM的时间反向传播(BPTT)

tensorflow、backpropagation、lstm

目前，我正试图理解TensorFlow中的LSTM的BPTT。我得到参数"num_steps“用于RNN展开和错误反向传播的范围。我有一个一般性的问题，这是如何运作的。问题：，哪些路径被反向传播了那么多步骤？恒等误差旋转木马由公式5创建，反传播(s(t)->s(t-1))的导数对于所有时

浏览 4提问于2016-11-29得票数 1

1回答

在扇区截断反向传播的PTB google官方教程中，有一个使用BasicLSTMCell的实现，它通过创建一个for循环来展开num_steps步骤的图形。final_state = state 我已经使用BasicLSTMCell实现了一个预测时间序列的方法，因为我没有在图中使用任何循环，但我在程序执行循环中更新了lstmCells的状态。, lstm_state_output1 = lstm_cell1(inpu

浏览 14提问于2016-07-29得票数 1

回答已采纳

1回答

LSTM损耗函数与反向传播

lstm、rnn、training、backpropagation

我试图理解损失函数和反向传播之间的联系。据我所知，在LSTM算法中，反向传播被用来获取和更新矩阵，在前向传播中使用偏差来获取当前的单元和隐藏状态。损失函数取训练集的预测输出和实际输出。但哪一部分是LSTM的培训部分？它们之间有某种联系吗？LSTM模式的培训目标是什么？

浏览 0提问于2019-08-31得票数 0

1回答

Tensorflow中RNN的截断回传(BPTT)

tensorflow、lstm、rnn

在这里，官方的TF文件说， words = tf.placeholder(tf.int32, [batch_size, num_steps])initial_state = state = tf.zeros

浏览 3提问于2017-10-08得票数 2

回答已采纳

1回答

在火炬中截断时间的反向传播(BPTT)

pytorch、backpropagation、truncated

在pytorch中，我训练RNN/GRU/LSTM网络，方法是启动反向传播(通过时间)：当序列很长时，我希望通过时间进行截断的反向传播，而不是使用整个序列的时间进行正常的反向传播但是，我在Pytorch中找不到任何参数或函数来设置截断的BPTT。我错过了吗？我应该自己在毕道尔编码吗？

浏览 3提问于2018-12-24得票数 6

1回答

有状态低LSTM模型的TensorFlow不同输入输出形状

python、tensorflow、keras、lstm、lstm-stateful

我想要创建一个“序列”模型(您可能已经猜到了一个时间序列模型)，它使用20过去的数据，其特征大小为2，并以相同的2特性大小预测1日的未来。我发现您需要为一个有状态的LSTM模型指定批大小，所以如果我指定一个批大小为32，那么模型的最终输出形状是(32, 2)，我认为这意味着该模型预测的是未来的32天数，而不是1。此外，在我到达问题之前询问；例如，如果我指定了32的批处理大小，但我想对形状(1, 20, 2)的输入进行

浏览 1提问于2020-11-15得票数 0

回答已采纳

2回答

Scikit MLPClassifier诉Tensorflow* DNNClassifier*

neural-network、scikit-learn、tensorflow

我正试图理解Scikit MLPClassifier和Tensorflow DNNClassifier在分类任务上的区别，并希望一些专家能够分享一些信息。据我所知，它们都支持反向传播、激活函数(包括relu)、optmizer (sgd/adam)。MLPClassifier还可以通过指定隐藏层和节点的#来建立深度神经网络。我看到的两种不同之处是，DNNClassifier支持GPU培训，而MLPClassifer不支持。除了GPU支持之外，它们之间还有其他区别吗？为什么要使用

浏览 0提问于2017-11-01得票数 2

2回答

R神经网络多隐层包

r、neural-network、cran

我一直在使用matlab上的神经网络，但无法找到一个允许神经网络多个隐藏层的包。建议使用“`nnet”包，但它只允许一个对我没有用处的层网络。还有其他能像matlab那样训练复杂神经网络的软件包吗？ (如果存在，则可能应该更新CRAN页面。对如何做到这一点有什么想法吗？)

浏览 4提问于2014-06-04得票数 4

1回答

seq2seq -编码器反向传播

machine-learning、tensorflow、lstm、backpropagation、encoder

我很难理解seq2seq模型中的编码器是如何进行反向传播的.没有标签，因此不可能计算错误，这是反向传播的，但LSTM层的权重被以某种方式更新。l_enc_input = Input(batch_shape=(batch_size, None, embedding_size)) l_enc_lstm = LSTM(encoding_size,stateful=True, dropou

浏览 7提问于2017-09-22得票数 1

1回答

LSTM反向传播，然后是最大/平均池化

neural-network、lstm、backpropagation

最大/平均池是基于LSTM输出生成表示的方法。在这种情况下，反向传播是如何发生的？我理解在未完成池化的情况下反向传播是如何发生的。但我想知道在上述情况下是如何发生的。提前谢谢。

浏览 0提问于2018-07-20得票数 0

1回答

截断反向传播对时间反向传播步数的影响

tensorflow、backpropagation、lstm、recurrent-neural-network

我目前正在开发一个利用tensorflow的LSTM细胞进行时间序列预测的模型。我的模型类似于。它可以工作，但是我不知道当使用截断的反向传播时，如何理解回退参数的数目(在示例中这个参数称为num_steps )。据我所知，模型参数在每个num_steps步骤之后都会更新。但这是否也意味着该模型不识别比num_steps更远的依赖项。我认为应该是因为内部国家应该抓住他们。但是，哪个效应有一个大&#x

浏览 1提问于2016-06-02得票数 2

回答已采纳

1回答

在对一个例子进行训练后，神经网络的损失增加了，这正常吗？

python、machine-learning、neural-network、lstm、recurrent-neural-network

我目前正在测试LSTM网络。在反向传播之前和反向传播之后，我将其预测的损失打印在训练示例上。之后的损失应该总是小于之前的损失，这是有意义的，因为网络只是在该示例上进行了训练。然而，我注意到在第100个训练示例左右，网络在反向传播之后开始给出比在训练示例上反向传播之前更不准确的预测。一个网络总是期望前损失高于后损失吗？如果是这样的话，有没有什么原

浏览 3提问于2018-11-25得票数 0

1回答

在中间层中重新组织输出时，tensorflow将如何处理反向传播

tensorflow、backpropagation

我有一个带有隐藏层的神经网络，它输出一个数字A，然后我使用一个函数，它使用A来生成一个向量。问题是TF在反向传播时能正确处理这个问题吗？我确实在TF中尝试过，它可以输出一些东西，但我仍然不确定bp是否工作正常。顺便说一句，我用来从数字生成向量的函数是(V是上一层的输出，d是我输入的值，G是常量)： dmn = [] for k in range(G):

浏览 6提问于2017-10-05得票数 0

2回答

tensorflow如何使用反向传播来训练模型？

machine-learning、neural-network、tensorflow

我是tensorflow的初学者，我想实现MLP并基于反向传播算法对其进行训练，但当我阅读教程时，我发现它使用了像“随机梯度下降”这样的优化器，并在没有实现算法阶段的情况下调用了反向传播。这是如何反向传播的？

浏览 8提问于2016-12-15得票数 1

1回答

Tensorflow RNN序列训练

tensorflow

我正在做我的第一步学习TF和有一些困难的训练RNN。我的玩具问题是这样的:一个两层的LSTM +密集层网络被输入原始音频数据，并且应该测试声音中是否存在一定的频率。我已经在Keras上完成了这个任务，并看到了类似的TFLearn解决方案，但我希望以一种相对高效的方式在裸Tensorflow上实现这一点。我的(很多)问题:如何使这个网络直接从Tensorflow返回一个序列，而不对

浏览 1提问于2016-10-08得票数 1

回答已采纳

1回答

在模型训练期间，tensorflow中保存的激活值在哪里？

tensorflow2.0、activation-function

在tensorflow2中，我们知道在反向传播过程中，我们需要权重和激活来计算偏导数，我可以在模型tf.keras.Model中找到权重，但是激活值(用于反向传播计算的中间值)，它们存储在哪里？

浏览 14提问于2021-09-21得票数 0

点击加载更多

具有Tensorflow或Theano的循环计算图

Tensorflow中的反向传播(穿越时间)代码

在LSTM中“截断梯度”是什么意思？

用于在Keras中初始化LSTM单元状态的MLP

LSTM的时间反向传播(BPTT)

LSTM损耗函数与反向传播

Tensorflow中RNN的截断回传(BPTT)

在火炬中截断时间的反向传播(BPTT)

有状态低LSTM模型的TensorFlow不同输入输出形状

Scikit MLPClassifier诉Tensorflow* DNNClassifier*

R神经网络多隐层包

seq2seq -编码器反向传播

LSTM反向传播，然后是最大/平均池化

截断反向传播对时间反向传播步数的影响

在对一个例子进行训练后，神经网络的损失增加了，这正常吗？

在中间层中重新组织输出时，tensorflow将如何处理反向传播

tensorflow如何使用反向传播来训练模型？

Tensorflow RNN序列训练

在模型训练期间，tensorflow中保存的激活值在哪里？

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐