如果我使用嵌入层，我如何解码我的seq-to-seq模型的输出？_如果我使用backbone验证，如何测试模型的验证_为什么这是我的线性模型的输出，我如何修复它？ - 腾讯云开发者社区

python-3.x、tensorflow、keras、word-embedding、sequence-to-sequence

我有一个seq to seq模型，训练了一些聪明的机器人数据： justphrases_X是一个句子列表，justphrases_Y是对这些句子的响应列表。batch_size = 1, epochs=1) #, validation_data = (testX, testy) model.save("cleverbottheseq-uel.h5") 当我使用此模型进行预测时，由于我使用softmax，因此输出将介于0和1之间。然而

浏览 10提问于2020-11-09得票数 0

1回答

如何在将单词表示为嵌入的同时，对整个语音预测建立LSTM自动编码模型

tensorflow、keras、lstm、autoencoder、seq2seq

我还创建了这个模型的各种版本。在第二个场景中，我在<

浏览 0提问于2019-07-08得票数 0

回答已采纳

1回答

输入到“序列到序列”模型的“解码器”应该是什么？

python、machine-learning、keras、keras-layer、rnn

我正在开发一个用于文本生成的序列到序列模型() .在解码器端不使用“教师强制”，即将t0的解码器输出输入到time t1的解码器中。现在，在实际中，解码器的输出(LSTM/GRU)通过一个密集的层，在tern中生成字的索引，该索引被认为是解码器的输出</em

浏览 2提问于2018-04-02得票数 0

2回答

是否有可能访问拥抱面板变压器嵌入层？

python、machine-learning、nlp、huggingface-transformers、transformer-model

我想使用一个预先训练的拥抱脸变压器语言模型作为编码器在一个序列序列模型。或者你还会推荐其他的方法？

浏览 6提问于2022-04-01得票数 0

回答已采纳

1回答

Keras和Pytorch编解码模型的差异

keras、nlp、pytorch、lstm

在编码器-译码器模型的构造之间，似乎存在着显著的、根本性的差异.这是，这是。 Pytorch使用在编码器中没有激活的嵌入层，但对解码器中

浏览 9提问于2020-06-09得票数 0

回答已采纳

3回答

在单词嵌入后输出一个单词而不是一个向量？

python、nlp、rnn、word-embeddings

我试着玩一个翻译或文字摘要的玩具实现。我现在明白了，大多数人在使用任何模型之前都会使用嵌入层，这会产生类似于300维向量的东西。但是模型输出的是什么呢？就像编解码模型一样，它的输入是这些向量的序列。那么，解码器的最后一层是什么呢？不像事件抽取或类似的东西，我

浏览 0提问于2016-11-15得票数 4

回答已采纳

1回答

GPT-2体系结构问题

machine-learning、neural-network、nlp、pytorch、gpt

我目前正在研究一个NLP模型，它比较两个评论，并确定哪一个会更受欢迎。我已经提出了一个架构-它将基于GPT-2。但是现在我很难理解它的输出的一般格式。我检查了GPT-2的这 PyTorch实现，下面是我所理解的：区块只是一个具有注意层和卷积层<e

浏览 0提问于2023-03-17得票数 0

回答已采纳

1回答

如何反转PyTorch嵌入？

deep-learning、pytorch、autoencoder

我在PyTorch中有一个多任务编码器/解码器模型，在输入端有一个(可训练的) torch.nn.Embedding嵌入层。在一个特定的任务中，我希望预先训练模型自监督(以重新构造屏蔽输入数据)，并将其用于推理(以填补数据中的空白)。我想对于训练时间，我可以用输入嵌入和输出嵌入之间的距离来衡量损失。

浏览 16提问于2020-10-25得票数 6

回答已采纳

1回答

基于Keras的基于译码器输入seq2seq模型的注意层连接

python、tensorflow、keras、deep-learning

我正在尝试使用Keras库来实现Sequence2序列模型。该模型的框图如下模型将输入序列嵌入到三维张量中。然后，双向lstm创建编码层。接下来，将编码的序列发送到自定义注意层，该自定义注意层返回对每个隐藏节点具有注意力权重的2D张量。将解码器输入作为一个热向量注入到模型中。现在，在解码器(另一个双lstm)中，将

浏览 0提问于2018-07-25得票数 6

回答已采纳

1回答

在培训阶段，变压器模型中的第一个解码器层的输入是什么？

deep-learning、transformer

我正试图让我的头脑了解变压器的架构是如何工作的。我认为我对编码器部分有一个很好的顶层理解，可以理解键、查询和值张量是如何在MultiHead注意层中工作的。我挣扎的是解码器部分，特别是对第一个解码器层的输入。我知道有两件事。最后的编码器<

浏览 0提问于2021-02-05得票数 7

回答已采纳

2回答

带有元数据的时间序列自动编码器

time-series、metadata、autoencoder、anomaly-detection

目前，我正在尝试构建一个自动编码器，用于检测时间序列数据中的异常。我的方法基于本教程：使用普通的MLP网络，您可以有一个用于时间序列的网络和一个用于元数据的网络，并将它们合并到更高层。但是如何<

浏览 22提问于2021-04-18得票数 0

1回答

无法理解图像分割研究论文中以下几行的含义

neural-network、deep-learning、computer-vision、convolution

我正在执行一篇关于图像分割的论文。它基于对u-net体系结构的轻微修改. Layer . Output size . Filter Size Stride DropoutConv12Conv11Upsampling3Conv

浏览 0提问于2019-07-25得票数 6

回答已采纳

1回答

当您提示GPT3时，输入数据会发生什么变化？

nlp、artificial-intelligence

例如，假设我打开操场，输入"Quack“。模型是如何处理这5个字符的，以确定下一步应该使用哪些字母或单词？ (碰巧的是，GPT3用“庸医”填充了这个提示，然后对细胞治疗进行了长篇大论。奇怪)。

浏览 1提问于2022-07-10得票数 -1

1回答

如何创建一个输入形状变化但输出形状固定的解码器？

python、tensorflow、keras、decoder

最近我在为mnist玩自动编码器，这个问题出现了。“是否有可能建立一个输入形状不同但输出形状固定的模型？”示例：想象使用输

浏览 9提问于2022-09-25得票数 0

回答已采纳

1回答

Keras :如何在损失函数中使用层的权重？

keras、embedding、tensor、loss

我在keras中实现了一个自定义的损失函数。该模型是一个autoencoder。但是嵌入层是可训练的，并且损失必须使用嵌入层的权重(我必须对我的词汇表的所有单词嵌入求和)。例如，如果我想训练玩具的例子：“猫”。嵌入层的<

浏览 1提问于2017-11-17得票数 6

1回答

TensorBoard投影仪中的主成分分析如何连接到训练好的模型？

tensorflow、pca、tensorboard

我正在尝试用TensorFlow在结构化数据上实现一个多标签分类器。我使用具有两个完全连接的层的神经网络，但我还集成了嵌入，如此中所述，因此我可以在TensorBoard投影仪中看到PCA图。我注意到，当我更改模型时，PCA图保持不变。那么，TensorBoard投影是如何连接到模型的呢？我如何使用这个PCA<

浏览 5提问于2018-02-11得票数 0

回答已采纳

7回答

为什么译码器不是伯特架构的一部分？

nlp、bert、machine-translation、attention-mechanism

我看不出伯特是如何在不使用解码器的情况下做出预测的，这是之前所有模型的一部分，包括变压器和标准RNN。如何在不使用解码器的情况下在BERT体系结构中进行输出预测？怎么才能完全消除解码器呢？换句话说，我可以用什么解码器和伯特一起生成输出文本？如果BERT只编码，我</e

浏览 0提问于2019-12-21得票数 22

回答已采纳

1回答

Keras中的VAE :如何定义端到端模型？

python、keras、autoencoder

我在这里学习。我的模型部分是： paddingz_decoded) # vae = Model(input_img, x)vae.summary() 我的问题是我们应该计算input_img和z

浏览 2提问于2018-11-11得票数 1

1回答

Keras ValueError:检查目标时出错:期望dense_15具有三维，但得到了形状为(301390，8)的数组

python、machine-learning、keras、deep-learning、nlp

我有8个类，我想从输入文本预测。下面是我的预处理数据的代码：tok = Tokenizer(num_words=num_max)mat_texts0 0 0 0 0 0 0 0 0 0下面是我的模型的

浏览 1提问于2018-11-23得票数 0

回答已采纳

1回答

神经网络中的超长序列

deep-learning、lstm、sequence、sequence-to-sequence

初学者关于神经网络中序列的问题:假设我有分类问题，看起来如下：类取决于整个序列--不可能在没有看到所有类的情况下确定类。NN是怎么处理这个的？我已经阅读过各种方法，例如截断序列(这是一个问题--序列的截短部分没有类，所以我不能标记它)，使用编码器/解码器lstm (同样，不能完全理解它如何解决问题)等等。

浏览 0提问于2018-05-03得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云