腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(7124)
视频
沙龙
1
回答
Pytorch
LSTM
-
用于
Q&A
分类
的
训练
lstm
、
pytorch
我正在尝试
训练
一个模型来
分类
,如果一个答案回答了使用这个给出
的
问题。 我正在批量
训练
,并使用 word嵌入。除了最后一个,我分1000个批次进行
训练
。我尝试使用
的
方法是,首先给出第一句话(问题),然后给
LSTM
第二句话(答案),让它使用sigmoid函数给我一个介于0和1之间
的
数字。问题是,损失总是在时期1之后重复,它永远不会收敛到正确
的
结果,即如果答案属于问题,则为1,否则为0。或者还有我要监督
的
其他问题吗?编辑:
浏览 1
提问于2018-08-17
得票数 0
回答已采纳
1
回答
在
PyTorch
中部分
训练
后添加样本
python
、
neural-network
、
pytorch
我在
PyTorch
中
训练
了一个模型--一个
用于
文本
分类
的
RCNN。该模型具有很高
的
精确度和召回性,但我最终可能会收到带有文本
的
新文档,这与我用来
训练
、验证或测试模型
的
内容不同。我想添加新
的
文本样本到模型,而不重新培训模型从一开始。这是可取
的
,因为我可能无法接触到一些
用于
初步培训
的
文本。如果不可能添加样本(文档),是否可以仅在新样本上
训练
新模型,然
浏览 2
提问于2021-01-22
得票数 0
回答已采纳
1
回答
目标为同维向量时word2vec矢量
训练
的
损耗函数
的
选择
pytorch
、
lstm
、
word2vec
我有一个
lstm
,我用它作为序列发生器,
训练
word2vec向量.以前
的
实现为所有不同
的
标签产生了概率分布。词汇中
的
每个单词都有一个标签。这个实现使用了
Pytorch
的
CrossEntropyLoss。我现在想改变这一点,以便
lstm
输出一个向量,其维数与
用于
训练
的
向量相同。通过这种方式,我可以使用euclydian距离度量来匹配词汇表中
的
附近向量。问题是,为了做到这一点,我必须使
浏览 1
提问于2019-09-25
得票数 0
回答已采纳
2
回答
用于
未知
的
初始嵌入,填充?
deep-learning
、
nlp
、
lstm
、
word-embeddings
上一次,我将经过预先
训练
的
单词嵌入到
LSTM
中,以解决文本
分类
问题。通常,有额外
的
<pad>,<unk>替代填充和未知类型。当然,没有预先
训练
过
的
载体。我想出
的
解决方案是用零填满他们注意:如果有关系,我会使用
pytorch
+torchtext。
浏览 0
提问于2018-05-29
得票数 5
1
回答
应该使用哪个BiLSTM层
的
输出进行
分类
python
、
lstm
、
pytorch
、
text-classification
我试图为文本
分类
问题实现一个BiLSTM层,并为此使用
PyTorch
。self.bilstm = nn.
LSTM
(embedding_dim,
lstm
_hidden_dim//2, batch_first=True, bidirectional=True)对于文本
分类
,应该使用哪一种?如果我使用ht,对于bidirectional=True来说,它是形状
的
(2,
浏览 0
提问于2021-04-29
得票数 0
1
回答
训练
CNN-LSTLM端到端?
neural-network
、
tensorflow
、
deep-learning
、
torch
已经有许多论文(特别是图像标题)将CNN和
LSTM
架构联合
用于
预测和生成任务。然而,他们似乎都是独立于
LSTM
训练
CNN
的
。我在浏览Torch和TensorFlow (用Keras),却找不到为什么不可能进行端到端
的
培训(至少从架构设计
的
角度来看),但似乎没有任何关于这种模型
的
文档。 那么,能做到吗?火炬或TensorFlow (甚至西亚诺斯或卡菲)是否支持联合
训练
端到端
的
CNN神经网络?如果是这样的话,是否就像将输
浏览 2
提问于2016-10-17
得票数 8
1
回答
如何在python中从预先
训练
好
的
模型中获得权重,并在tensorflow中使用?
python
、
tensorflow
、
pytorch
、
lstm
如何在
PyTorch
中从预先
训练
好
的
模型中获取权重并在TensorFlow中使用?这是预先
训练
好
的
模型:
lstm
= torch.hub.load("BruceWen120/medal", "
lstm
")
浏览 3
提问于2021-11-28
得票数 0
1
回答
是否有可能将火把和火炬
的
几何模型结合起来?
pytorch
、
pytorch-geometric
我正在处理一个使用图形数据
的
节点
分类
问题。通过简单地将网络应
用于
单个节点(例如,忽略图形结构),我使用了
PyTorch
对节点进行
分类
,并使用
PyTorch
几何方法应用GNN (例如GCN)对节点进行
分类
。是否可以将
PyTorch
中
的
模型作为
PyTorch
几何中
的
最后一层?我对这将如何工作感到有点困惑,因为对torch.nn.Module
的
输入是一个
用于
GNN情况<
浏览 0
提问于2022-12-16
得票数 1
回答已采纳
1
回答
如何用python中
的
非图像数据为
LSTM
建立预
训练
模型?
python
、
tensorflow
、
keras
、
lstm
、
pre-trained-model
我有像这样
的
加速度计和陀螺仪传感器
的
数据--我想要创建一个经过预先
训练
的
模型,
用于
使用数据
的
LSTM
方法进行
分类
-- python中
的
。这有可能吗?因为根据我所读到
的
,预先
训练
的
是
用于
图像数据和方法,如CNN进行
分类
。此外,我试图找到经过预先培训
的
数据,但没有找到,所以我怀疑这是否可能。 如果我使用
LSTM<
浏览 3
提问于2021-09-27
得票数 0
1
回答
美国有线电视新闻网->
LSTM
级联模型到
PyTorch
闪电
python
、
deep-learning
、
conv-neural-network
、
lstm
、
pytorch-lightning
我试图隐藏
PyTorch
代码
的
CNN ->
LSTM
级联模型到
PyTorch
闪电。在nn.Module码中有两个
PyTorch
类,一个
用于
CNN (编码器),一个
用于
LSTM
(译码器),最后一个隐藏层作为
PyTorch
的
输入。因此,在转换到
PyTorch
闪电之后,有两个pl.LightningModule类。我想知道如何在这两个类中填充所需
的
方法。以下是
PyTorc
浏览 0
提问于2021-08-03
得票数 0
1
回答
用于
可变尺寸输入
的
小型批量培训
python
、
neural-network
、
deep-learning
、
pytorch
、
autograd
我是
PyTorch
和RNN
的
新手,所以我很困惑如何为我拥有的数据实现小型批量培训。有更多
的
这些数据,但我想保持简单,所以我只能理解如何实现小批量培训部分。我正在进行多类
分类
,基于
LSTM
/GRU在可变长度输入上
训练
的
最终隐藏状态。我设法使它与批处理大小1(基本上是SGD)工作,但我正在努力实现小型批。= DataLoader(inputs, batch_size=batch_size, shuffle=True)
浏览 3
提问于2018-02-14
得票数 7
回答已采纳
1
回答
如何在
pytorch
中处理
LSTM
模型中
的
多标签
分类
python
、
pytorch
我正在做一个多标签
分类
(4个标签)任务,特别是文本
分类
。我得到1000个文本,每个文本有50个单词和一个标签,每个单词嵌入100个维度,我使用
pytorch
。我有一个问题,每个文本都有不同
的
长度,例如十个单词,五个单词或八个单词。我首先将单词嵌入到100维中,我知道
LSTM
是序列长度无关
的
。所以我可以处理每一个txt成功,但是我如何同时处理多个txt呢?当我处理许多txt时,我只需将txt填充到相同
的
长度(20len),然后在batch_first中
训练</em
浏览 24
提问于2019-11-08
得票数 0
1
回答
仅检索
pytorch
序列中
lstm
层
的
最后一个隐藏状态
pytorch
、
lstm
、
tensorflow.js
、
tensorflowjs-converter
我有一个
pytorch
模型: torch.nn.
LSTM
(40, 256, 3, batch_first=True),torch.nn.Linear(256, 256),)_, (hidden, _) =
lstm
(data)尽管如此,该示例仅适
用于</e
浏览 5
提问于2021-10-05
得票数 0
2
回答
了解YOLO是如何
训练
的
keras
、
deep-learning
、
yolo
我正在努力理解YOLO (v2)是如何被
训练
的
。为此,我使用这个keras实现从零开始在VOC上
训练
YOLO (我对其他实现开放,但我从未使用过
pytorch
,因此,keras实现将是首选)。1-正如我所理解
的
,YOLO首先
用于
在imageNet上进行
分类
,然后这些经过
训练
的
权重(
用于
分类
)应该在
训练
yolo进行回归(检测边界框)时使用。在我在互联网上找到
的
用来从
浏览 5
提问于2020-03-27
得票数 2
回答已采纳
1
回答
实时传感器数据
的
多类
分类
time-series
、
tensorflow
、
keras
我想用加速度计来检测火车
的
方向。您可以通过手动设置阈值来检测x轴上
的
加速度方向(该方向将与列车驱动轴对齐)。所以现在我可能可以使用RNN来创建这个上下文。我
的
想法是不使用RNN (因为它增加了复杂性),只是在一个样本中放置了几个度量。这将创造出网络需要判断
的
上下文--样本要么停滞不前,要么在X轴上加速正,在X轴上加速负值,或者如果火车只是正常行驶。 在我
的<
浏览 0
提问于2017-09-21
得票数 0
3
回答
(
pytorch
几何图形)
python
、
pytorch
、
graph-databases
如何将我自己
的
数据集转换为
pytorch
几何图形神经网络
的
可用数据集? 所有教程都使用已转换为可由
pytorch
使用
的
现有数据集。例如,如果我有自己
的
点云数据集,我如何使用它来
训练
图神经网络
的
分类
?我自己
的
用于
分类
的
图像数据集呢?
浏览 7
提问于2021-03-25
得票数 4
1
回答
为文本
分类
训练
数据
的
LSTM
模型权重
keras
、
lstm
、
text-classification
我使用Keras构建了一个
用于
文本
分类
的
LSTM
模型。现在我有了要
训练
的
新数据。我没有附加到原始数据并重新
训练
模型,而是考虑使用模型权重来
训练
数据。即使用新数据进行
训练
的
权重。然而,不管我
训练
的
量有多大,模型都不能预测正确
的
分类
(即使我给出相同
的
句子进行预测)。可能
的
原因是什么?请帮帮我。
浏览 1
提问于2018-11-26
得票数 0
1
回答
是否可以使用
LSTM
预测作为下一个时间步长
的
输入?
python
、
pytorch
、
lstm
、
recurrent-neural-network
我正在使用
LSTM
(在
PyTorch
中)进行多变量时间序列预测。让我们想象一下这样
的
情况:我有两个时间序列,A和B,我想用之前
的
A和B
的
值(在t之前)来预测B
的
t值。这样
的
预测效果很好,我
的
模型得到了很好
的
结果。 但是,如果(在测试期间,在
训练
之后)我想使用B
的
预测值作为下一个时间步
的
输入而不是实际值,该怎么办?例如:我预测B
的
第一个值,走一步,把预测值代替真实
浏览 1
提问于2020-04-17
得票数 0
1
回答
LSTM
自动编码器
的
这些实现之间
的
区别?
python
、
tensorflow
、
keras
、
pytorch
例1 (TensorFlow):model = Sequential()model.add(TimeDistributed(Dense(1)))该实现在应用
浏览 4
提问于2020-12-07
得票数 4
回答已采纳
1
回答
PyTorch
LSTM
中
的
batch_first
python
、
pytorch
、
lstm
我是这个领域
的
新手,所以我仍然不了解
PyTorch
LSTM
中
的
batch_first。我尝试了别人向我推荐
的
代码,当batch_first = False时,它对我
的
训练
数据起作用,它为官方
LSTM
和手动
LSTM
产生相同
的
输出。当batch_first = True时,手动
LSTM
的
哪个部分需要更改才能产生与官方
LSTM
相同
的
输出?
py
浏览 83
提问于2021-09-23
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券