Pytorch LSTM -用于Q&A分类的训练

文章/答案/技术大牛

发布

1回答

lstm、pytorch

我正在尝试训练一个模型来分类，如果一个答案回答了使用这个给出的问题。我正在批量训练，并使用 word嵌入。除了最后一个，我分1000个批次进行训练。我尝试使用的方法是，首先给出第一句话(问题)，然后给LSTM第二句话(答案)，让它使用sigmoid函数给我一个介于0和1之间的数字。问题是，损失总是在时期1之后重复，它永远不会收敛到正确的结果，即如果答案属于问题，则为1，否则为0。或者还有我要监督的其他问题吗？编辑:

浏览 1提问于2018-08-17得票数 0

回答已采纳

1回答

在PyTorch中部分训练后添加样本

python、neural-network、pytorch

我在PyTorch中训练了一个模型--一个用于文本分类的RCNN。该模型具有很高的精确度和召回性，但我最终可能会收到带有文本的新文档，这与我用来训练、验证或测试模型的内容不同。我想添加新的文本样本到模型，而不重新培训模型从一开始。这是可取的，因为我可能无法接触到一些用于初步培训的文本。如果不可能添加样本(文档)，是否可以仅在新样本上训练新模型，然

浏览 2提问于2021-01-22得票数 0

回答已采纳

1回答

目标为同维向量时word2vec矢量训练的损耗函数的选择

pytorch、lstm、word2vec

我有一个lstm，我用它作为序列发生器，训练word2vec向量.以前的实现为所有不同的标签产生了概率分布。词汇中的每个单词都有一个标签。这个实现使用了Pytorch的CrossEntropyLoss。我现在想改变这一点，以便lstm输出一个向量，其维数与用于训练的向量相同。通过这种方式，我可以使用euclydian距离度量来匹配词汇表中的附近向量。问题是，为了做到这一点，我必须使

浏览 1提问于2019-09-25得票数 0

回答已采纳

2回答

用于未知的初始嵌入，填充？

deep-learning、nlp、lstm、word-embeddings

上一次，我将经过预先训练的单词嵌入到LSTM中，以解决文本分类问题。通常，有额外的<pad>，<unk>替代填充和未知类型。当然，没有预先训练过的载体。我想出的解决方案是用零填满他们注意:如果有关系，我会使用pytorch+torchtext。

浏览 0提问于2018-05-29得票数 5

1回答

应该使用哪个BiLSTM层的输出进行分类

python、lstm、pytorch、text-classification

我试图为文本分类问题实现一个BiLSTM层，并为此使用PyTorch。self.bilstm = nn.LSTM(embedding_dim, lstm_hidden_dim//2, batch_first=True, bidirectional=True)对于文本分类，应该使用哪一种？如果我使用ht，对于bidirectional=True来说，它是形状的(2,

浏览 0提问于2021-04-29得票数 0

1回答

训练CNN-LSTLM端到端？

neural-network、tensorflow、deep-learning、torch

已经有许多论文(特别是图像标题)将CNN和LSTM架构联合用于预测和生成任务。然而，他们似乎都是独立于LSTM训练CNN的。我在浏览Torch和TensorFlow (用Keras)，却找不到为什么不可能进行端到端的培训(至少从架构设计的角度来看)，但似乎没有任何关于这种模型的文档。那么，能做到吗？火炬或TensorFlow (甚至西亚诺斯或卡菲)是否支持联合训练端到端的CNN神经网络？如果是这样的话，是否就像将输

浏览 2提问于2016-10-17得票数 8

1回答

如何在python中从预先训练好的模型中获得权重，并在tensorflow中使用？

python、tensorflow、pytorch、lstm

如何在PyTorch中从预先训练好的模型中获取权重并在TensorFlow中使用？这是预先训练好的模型： lstm = torch.hub.load("BruceWen120/medal", "lstm")

浏览 3提问于2021-11-28得票数 0

1回答

是否有可能将火把和火炬的几何模型结合起来？

pytorch、pytorch-geometric

我正在处理一个使用图形数据的节点分类问题。通过简单地将网络应用于单个节点(例如，忽略图形结构)，我使用了PyTorch对节点进行分类，并使用PyTorch几何方法应用GNN (例如GCN)对节点进行分类。是否可以将PyTorch中的模型作为PyTorch几何中的最后一层？我对这将如何工作感到有点困惑，因为对torch.nn.Module的输入是一个用于GNN情况<

浏览 0提问于2022-12-16得票数 1

回答已采纳

1回答

如何用python中的非图像数据为LSTM建立预训练模型？

python、tensorflow、keras、lstm、pre-trained-model

我有像这样的加速度计和陀螺仪传感器的数据--我想要创建一个经过预先训练的模型，用于使用数据的LSTM方法进行分类-- python中的。这有可能吗？因为根据我所读到的，预先训练的是用于图像数据和方法，如CNN进行分类。此外，我试图找到经过预先培训的数据，但没有找到，所以我怀疑这是否可能。如果我使用LSTM<

浏览 3提问于2021-09-27得票数 0

1回答

美国有线电视新闻网-> LSTM级联模型到PyTorch闪电

python、deep-learning、conv-neural-network、lstm、pytorch-lightning

我试图隐藏PyTorch代码的CNN -> LSTM级联模型到PyTorch闪电。在nn.Module码中有两个PyTorch类，一个用于CNN (编码器)，一个用于LSTM (译码器)，最后一个隐藏层作为PyTorch的输入。因此，在转换到PyTorch闪电之后，有两个pl.LightningModule类。我想知道如何在这两个类中填充所需的方法。以下是PyTorc

浏览 0提问于2021-08-03得票数 0

1回答

用于可变尺寸输入的小型批量培训

python、neural-network、deep-learning、pytorch、autograd

我是PyTorch和RNN的新手，所以我很困惑如何为我拥有的数据实现小型批量培训。有更多的这些数据，但我想保持简单，所以我只能理解如何实现小批量培训部分。我正在进行多类分类，基于LSTM/GRU在可变长度输入上训练的最终隐藏状态。我设法使它与批处理大小1(基本上是SGD)工作，但我正在努力实现小型批。= DataLoader(inputs, batch_size=batch_size, shuffle=True)

浏览 3提问于2018-02-14得票数 7

回答已采纳

1回答

如何在pytorch中处理LSTM模型中的多标签分类

python、pytorch

我正在做一个多标签分类(4个标签)任务，特别是文本分类。我得到1000个文本，每个文本有50个单词和一个标签，每个单词嵌入100个维度，我使用pytorch。我有一个问题，每个文本都有不同的长度，例如十个单词，五个单词或八个单词。我首先将单词嵌入到100维中，我知道LSTM是序列长度无关的。所以我可以处理每一个txt成功，但是我如何同时处理多个txt呢？当我处理许多txt时，我只需将txt填充到相同的长度(20len)，然后在batch_first中训练</em

浏览 24提问于2019-11-08得票数 0

1回答

仅检索pytorch序列中lstm层的最后一个隐藏状态

pytorch、lstm、tensorflow.js、tensorflowjs-converter

我有一个pytorch模型： torch.nn.LSTM(40, 256, 3, batch_first=True),torch.nn.Linear(256, 256),)_, (hidden, _) = lstm(data)尽管如此，该示例仅适用于</e

浏览 5提问于2021-10-05得票数 0

2回答

了解YOLO是如何训练的

keras、deep-learning、yolo

我正在努力理解YOLO (v2)是如何被训练的。为此，我使用这个keras实现从零开始在VOC上训练YOLO (我对其他实现开放，但我从未使用过pytorch，因此，keras实现将是首选)。1-正如我所理解的，YOLO首先用于在imageNet上进行分类，然后这些经过训练的权重(用于分类)应该在训练yolo进行回归(检测边界框)时使用。在我在互联网上找到的用来从

浏览 5提问于2020-03-27得票数 2

回答已采纳

1回答

实时传感器数据的多类分类

time-series、tensorflow、keras

我想用加速度计来检测火车的方向。您可以通过手动设置阈值来检测x轴上的加速度方向(该方向将与列车驱动轴对齐)。所以现在我可能可以使用RNN来创建这个上下文。我的想法是不使用RNN (因为它增加了复杂性)，只是在一个样本中放置了几个度量。这将创造出网络需要判断的上下文--样本要么停滞不前，要么在X轴上加速正，在X轴上加速负值，或者如果火车只是正常行驶。在我的<

浏览 0提问于2017-09-21得票数 0

3回答

(pytorch几何图形)

python、pytorch、graph-databases

如何将我自己的数据集转换为pytorch几何图形神经网络的可用数据集？所有教程都使用已转换为可由pytorch使用的现有数据集。例如，如果我有自己的点云数据集，我如何使用它来训练图神经网络的分类？我自己的用于分类的图像数据集呢？

浏览 7提问于2021-03-25得票数 4

1回答

为文本分类训练数据的LSTM模型权重

keras、lstm、text-classification

我使用Keras构建了一个用于文本分类的LSTM模型。现在我有了要训练的新数据。我没有附加到原始数据并重新训练模型，而是考虑使用模型权重来训练数据。即使用新数据进行训练的权重。然而，不管我训练的量有多大，模型都不能预测正确的分类(即使我给出相同的句子进行预测)。可能的原因是什么？请帮帮我。

浏览 1提问于2018-11-26得票数 0

1回答

是否可以使用LSTM预测作为下一个时间步长的输入？

python、pytorch、lstm、recurrent-neural-network

我正在使用LSTM (在PyTorch中)进行多变量时间序列预测。让我们想象一下这样的情况:我有两个时间序列，A和B，我想用之前的A和B的值(在t之前)来预测B的t值。这样的预测效果很好，我的模型得到了很好的结果。但是，如果(在测试期间，在训练之后)我想使用B的预测值作为下一个时间步的输入而不是实际值，该怎么办？例如:我预测B的第一个值，走一步，把预测值代替真实

浏览 1提问于2020-04-17得票数 0

1回答

LSTM自动编码器的这些实现之间的区别？

python、tensorflow、keras、pytorch

例1 (TensorFlow)：model = Sequential()model.add(TimeDistributed(Dense(1)))该实现在应用

浏览 4提问于2020-12-07得票数 4

回答已采纳

1回答

PyTorch LSTM中的batch_first

python、pytorch、lstm

我是这个领域的新手，所以我仍然不了解PyTorch LSTM中的batch_first。我尝试了别人向我推荐的代码，当batch_first = False时，它对我的训练数据起作用，它为官方LSTM和手动LSTM产生相同的输出。当batch_first = True时，手动LSTM的哪个部分需要更改才能产生与官方LSTM相同的输出？py

浏览 83提问于2021-09-23得票数 0

回答已采纳

点击加载更多