在seq2seq模型中，训练解码器和推理解码器之间共享什么？

tensorflow、machine-learning、recurrent-neural-network、seq2seq

我目前正在开发一个seq2seq模型，但无法理解列车解码器和推理解码器之间共享的内容。

浏览 10提问于2019-07-02得票数 0

1回答

seq2seq中的提要非占位符变量

tensorflow、recurrent-neural-network

我正在使用Tensorflow seq2seq模型，我想知道如何为经过训练的seq2seq解码器提供任意的初始解码器内存(在训练期间，这个初始解码器内存是编码器的输出)。我认为我需要使用feed_dict和TF强制我输入序列，因为它定义了一个占位符，解码器输入也是如此。但如果我这样做了，我实际上不能强制初始解码器内存成为我想要的样子，因为它是从解码器输入定义的。

浏览 20提问于2017-01-28得票数 1

1回答

对tf.contrib.seq2seq.dynamic_docode final_outputs的理解

tensorflow、seq2seq

当我阅读seq2seq教程时，我无法理解tf.contrib.seq2seq.dynamic_docode函数的输出。本教程使用sample_id = outputs.sample_id和logits = self.output_layer(outputs.rnn_output)访问解码器在训练中使用的输出，而在推理中使用logits = outputs.rnn_output和sample_id = outputs.sample_id。logits和s

浏览 1提问于2018-05-24得票数 3

0回答

尝试在Keras中构建编码器-解码器模型时出现图形断开连接错误

python、keras、encoder-decoder

我正在尝试在Keras中实现一个基于下图的编码器-解码器模型的简化版本(来源：)。请注意，此模型中只有一个编码器和解码器，为了清晰起见，它们已在图像中展开。我现在只关注底部分支，不包括attention和一个样式标签s_i。为了获得指导，我一直在seq2seq模型上关注这个。是我定义这个模型的脚本。训练运行成功，但我在

浏览 3提问于2018-07-16得票数 1

回答已采纳

1回答

不偷看或不注意的简单深度seq2seq会收敛吗？

deep-learning、autoencoder

深度seq2seq模型有没有成功的应用，解码器在第一步只读取编码器的输出状态(编码器内部状态的最后一步)，并进行多步解码？在每一步，解码器的输入仅仅是前一步的输出和状态。我可以看到一些seq2seq自动编码器的实现，不知道它们在经过长时间的训练后是否真的收敛了，特别是当内部状态很小时。

浏览 0提问于2017-05-20得票数 0

1回答

seq2seq -编码器反向传播

machine-learning、tensorflow、lstm、backpropagation、encoder

我很难理解seq2seq模型中的编码器是如何进行反向传播的.没有标签，因此不可能计算错误，这是反向传播的，但LSTM层的权重被以某种方式更新。

浏览 7提问于2017-09-22得票数 1

2回答

如何在没有文档上下文的情况下去标记spacy文本？

nlp、spacy

我有一个序列序列模型，训练在spacy的标记化所形成的标记上。这是编码器和解码器。输入到Seq2Seq:某些文本在spacy中是否有任何API来逆转令牌化，这是由其令牌程序中的规则完成的？

浏览 1提问于2018-05-14得票数 3

回答已采纳

1回答

机器翻译中的Tensorflow解码器

tensorflow、lstm、machine-translation、encoder-decoder、gated-recurrent-unit

它有用于解码器的下列代码： def __init__(self, vocab_size, embedding_dim, dec_unitsshape == (batch_size, vocab)我在这里不明白的是，解码器的根据我的理解，只有当解码器用“思想向量”或编码器的最后隐藏状态初始化时，编码器和解码器之间才

浏览 3提问于2021-02-15得票数 1

回答已采纳

1回答

在自动编码器设置中，解码器的输入究竟是什么？

machine-learning、autoencoder

我正在回顾各种自动编码器设置，用于MNIST重建，Seq2Seq翻译和其他。我对数据流的天真理解如下：📷我想知道解码器的输入如何依赖于目标任务？为什么我们需要在隐藏状态之外放置输入序列？如有任何高级别的解释，我们将不胜感激。

浏览 0提问于2017-12-05得票数 3

回答已采纳

1回答

变压器译码器注意层中令牌在推理中的应用问题

matrix-multiplication、huggingface-transformers、transformer-model、attention-model、self-attention

我观察了解码器期间使用的形状(包括自关注块和enc-dec-关注点块)，并了解到解码器在训练期间的运行方式与基于推理的和原始的运行方式有所不同。在推理中，它使用之前生成的所有标记(例如，k第th时间步骤)，如下图所示，并在中解释。我非常困惑的是，在解码器的自我关注和decoder注意中的所有矩阵的形状如何能够在

浏览 5提问于2021-11-08得票数 0

1回答

Tensorflow嵌入

tensorflow、deep-learning、lstm、word2vec

我知道什么是嵌入，以及它们是如何训练的。准确地说，在参考tensorflow的文档时，我看到了两篇不同的文章。我想知道他们到底有什么不同。链接1：tf.nn.embedding_lookup()在训练LSTM网络时起作用。然而，在这第二篇文章中</e

浏览 5提问于2017-09-19得票数 0

1回答

变压器模型不同部分的权重共享

machine-learning、neural-network、deep-learning、nlp、transformer

📷 变压器的哪个部分分担重量，比如，所有的编码器都有相同的重量，还是所有的解码器都有相同的重量？

浏览 0提问于2020-11-04得票数 4

回答已采纳

1回答

在加载模型中将return_state=True设置为LSTM层

tensorflow、keras

我训练了一个编解码器模型，并将其保存到一个文件中，但结果发现我忘记了将解码器的LSTM层上的return_state标志设置为true。现在我无法实现推理。是否可以在构造函数之外为LSTM设置return_state标志？

浏览 0提问于2019-05-08得票数 0

回答已采纳

1回答

如何反转PyTorch嵌入？

deep-learning、pytorch、autoencoder

我在PyTorch中有一个多任务编码器/解码器模型，在输入端有一个(可训练的) torch.nn.Embedding嵌入层。在一个特定的任务中，我希望预先训练模型自监督(以重新构造屏蔽输入数据)，并将其用于推理(以填补数据中的空白)。我想对于训练时间，我可以用输入嵌入和输出嵌入之间的距离来衡量损失。

浏览 16提问于2020-10-25得票数 6

回答已采纳

1回答

为什么自动编码器的编码器部分不需要安装就能工作？

python、keras、autoencoder

the *test* setdecoded_imgs = decoder.predict(encoded_imgs) 在该示例中，只有模型autoencoder已经编译和安装，而encoder没有。我很困惑，为什么编码器可以直接预测新数据而不进行任何编译和拟合？

浏览 3提问于2022-01-25得票数 1

1回答

Tensorflow:注意力解码器

tensorflow、neural-network、deep-learning

在TensorFlow1.0中，seq2seq API发生了很大的变化，并且不再与以前的seq2seq示例兼容。特别是，我发现注意力解码器的构建相当具有挑战性:旧的attention_decoder函数已被移除，取而代之的是，新的API期望用户在训练和预测期间为dynamic_rnn_decoder提供几个不同的注意力函数有没有人知道如何构建注意力解码器，只提供输入和最终的编码器状态？

浏览 3提问于2017-02-20得票数 0

1回答

将seq2seq* NLP模型转换为ONNX格式是否会对其性能产生负面影响？*

python、machine-learning、nlp、huggingface-transformers、onnx

我正在考虑将ml模型转换为ONNX格式，以便利用它的速度增长(ONNX )。然而，我并不真正理解与旧模型相比，新模型中发生了什么根本性的变化。而且，我也不知道是否有什么缺点。

浏览 3提问于2021-02-13得票数 2

回答已采纳

1回答

Transformer Decoder只使用什么内存？

python、pytorch、decoder、transformer、gpt-2

我读了很多关于转换器和自我注意的文章，看到BERT和GPT-2都是一个较新的版本，只使用了编码器变压器(BERT)和解码器变压器(GPT-2)。我一直试图为自己构建一个解码器模型，用于下一个序列预测，但被一件事搞糊涂了。我使用的是PyTorch，我先看了Seq2Seq tutorial，然后又研究了由Transformer Decoder Layers组成的Transformer Decoder Block。在文档中，他们说内存是编码块的最后一层，这对

浏览 19提问于2020-12-17得票数 1

1回答

Tensorflow sequence2sequence模型填充

tensorflow

在seq2seq模型中，使用垫子使桶中的所有序列具有相同的长度。除此之外，似乎没有对垫子进行特殊处理：编码器对填充物进行编码，以及基本解码器w/o注意解码使用最后一种编码--编码解码器的填充--注意填充输入的隐藏状态--如果能澄清这一点将是非常有帮助的:实际上，这些填充仅仅是一个特殊的id/嵌入，而当前的seq2seq实现对待它们就像对待其他嵌入一样？所以在填充之后，对填充没有什么特别的处理，我

浏览 1提问于2016-02-22得票数 1

1回答

Seq2Seq/ NLP/ target :生成目标句子后，最后一个解码器隐藏状态是否带有任何剩余意义？

machine-learning、nlp、artificial-intelligence、recurrent-neural-network、machine-translation

假设我们在并行语料库上训练编解码器Seq2Seq En-Fr翻译系统，从预先训练的Eng和Fr字向量开始。该系统可以使用任何形式的句子嵌入(变形金刚，LSTM等)。然后，Seq2Seq翻译系统的工作是学习从英字向量构建英句表示，学习从法语单词向量构建法语句子表示，并通过编解码器的链接，在相同的空间中学习这两个句子表示。我的问题是:在输出(EOS)之后，是否有对最后一个解码器隐藏状态的解释？还有<em

浏览 6提问于2020-01-24得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

seq2seq中的提要非占位符变量

对tf.contrib.seq2seq.dynamic_docode final_outputs的理解

尝试在Keras中构建编码器-解码器模型时出现图形断开连接错误

不偷看或不注意的简单深度seq2seq会收敛吗？

seq2seq -编码器反向传播

如何在没有文档上下文的情况下去标记spacy文本？

机器翻译中的Tensorflow解码器

在自动编码器设置中，解码器的输入究竟是什么？

变压器译码器注意层中令牌在推理中的应用问题

Tensorflow嵌入

变压器模型不同部分的权重共享

在加载模型中将return_state=True设置为LSTM层

如何反转PyTorch嵌入？

为什么自动编码器的编码器部分不需要安装就能工作？

Tensorflow:注意力解码器

将seq2seq* NLP模型转换为ONNX格式是否会对其性能产生负面影响？*

Transformer Decoder只使用什么内存？

Tensorflow sequence2sequence模型填充

Seq2Seq/ NLP/ target :生成目标句子后，最后一个解码器隐藏状态是否带有任何剩余意义？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐