Pytorch model.train()和教程中编写的分离序列()函数_如何编写一个函数来处理字典类型序列和Dataframe中的列？ - 腾讯云开发者社区

python、machine-learning、pytorch

我是PyTorch的新手，我想知道您是否可以向我解释一下PyTorch中的默认model.train()函数和这里的train()函数之间的一些关键区别。另一个PyTorch ()函数位于文本分类的官方train教程中，对于模型权重是否在训练结束时存储感到困惑。predictions.append(guess)

浏览 24提问于2019-06-26得票数 0

2回答

pytorch attention seq2seq教程中的错误？

pytorch、seq2seq

我正在用Pytorch编写序列神经网络的序列。在official Pytorch seq2seq tutorial中，有一个注意力解码器的代码，我不能理解/认为可能包含错误。它通过连接输出和此时的隐藏状态来计算每个时间步的注意力权重，然后乘以一个矩阵，得到一个大小等于输出序列长度的向量。注意，这些注意力权重不依赖于编码器序列(在代码<e

浏览 37提问于2019-05-03得票数 1

1回答

Pytorch深度学习-验证应该在时代循环内部还是外部？

validation、deep-learning、pytorch

我已经看到大多数教程/指南在epoch循环之外都有验证步骤。不过，我所遵循的指南在epoch循环中有验证步骤。哪一个是对的？我注意到，如果您在epoch循环中进行了验证，您可以绘制每个时代损失的验证图，但是您不能有一个正确的混淆矩阵(因为再次验证相同的图像数据集)，反之亦然。或者我还没找到合适的方法。有什么建议吗？谢谢

浏览 2提问于2022-01-01得票数 0

1回答

正确的方法来创建Pytorch数据集，返回RNN的数据序列？

python、deep-learning、dataset、pytorch、rnn

我正在尝试对时间序列数据进行RNN训练，虽然有很多关于如何构建RNN模型的教程，但我在为这个任务构建dataloader对象方面遇到了一些困难。数据都将是相同的长度，所以也不需要填充。到目前为止，我采取的方法是返回dataset类上的getitem函数中的一系列数据，并将长度定义为不过，我觉得这有点“无趣”，应该有一个更恰当的办法。更具体地说，我认为以某种方式在Py电

浏览 0提问于2018-08-20得票数 2

回答已采纳

2回答

在训练和测试时间pytorch上以不同方式管理内存

python、deep-learning、conv-neural-network、pytorch

目前，我正在用pytorch编写一个基于U-net的分割模型，我想使用类似于mobilenet v2上引入的倒置残差来提高模型在cpu上的速度。然后我意识到模型在训练阶段和测试阶段使用了更多的内存。虽然模型应该在训练阶段使用更多的内存，因为所有的中间步骤张量(特征图)都被保存了，并且使用可分离的卷积，为每个“卷积”操作创建了更多的张量。在测试阶段，具有正常卷积的u-net

浏览 1提问于2019-04-13得票数 0

2回答

如何基于基于字符的RNN模型进行字符预测？

nlp、lstm、recurrent-neural-network

我想创建一个预测函数来完成“句子”的一部分，这里使用的模型是基于字符的RNN(LSTM)。我们应该做些什么呢？

浏览 43提问于2020-10-22得票数 0

回答已采纳

1回答

在Pytorch中不使用训练掩码-将数据输入到训练模型(文档)时的几何形状

model、pytorch、training-data、pytorch-geometric

我正在阅读Pytorch-Geometric (here)。在下面的代码中，我们看到在没有train_mask的情况下，data被传递给模型。但是，当将输出和标签传递给损失函数时，train_mask将同时应用于这两个函数。在将data输入到模型中时，我们不是也应该将train_mask应用于它吗？在我看来，这应该不是问题。然而，看起来我们是在浪费未用于训练模型的输出上的计算。model.train() for e

浏览 39提问于2021-09-01得票数 0

回答已采纳

2回答

深度学习图书馆中NLP的动态批处理和填充批

nlp、pytorch、huggingface、dynamic-batching、pad-truncate

这是我们训练NLP的现代深度学习模型的常用方法，例如，在Huggingface库中，输入no有一个固定的长度。指记号/音音单位。https://huggingface.co/docs/transformers/pad_截断在下面的例子中，我们有5个不同长度的句子，它们都被填充到最大长度设置为1024。我问题的第一部分是关于GPU内存的使用和pad，当我们训练带有填充输入<e

浏览 0提问于2023-04-07得票数 2

1回答

PyTorch中的火炬脚本是什么？

pytorch、jit

我刚刚发现PyTorch文档公开了一些叫做的东西。不过，我不知道：他们的好处是什么？

浏览 1提问于2018-12-23得票数 53

回答已采纳

1回答

pytorch中的大数据，帮助调优步骤

python、pytorch、bigdata、dataloader

我以前曾分裂过我的大人物：# X_test.shape : 2M samples x 2K featuresvalidation_generator = data_utils.DataLoader(test, batch_size=20000, shuffle=True) 我从一个网络课程中复制了这个例子correct += ((1*(predicted>.5)) == np.array(local_labels)).sum

浏览 10提问于2022-01-01得票数 2

回答已采纳

1回答

如何在自动梯度中逐个分配方程元素

python、autograd、automatic-differentiation

我正在尝试实现一个基于自动梯度的非线性PDE求解器。和大多数PDE一样，我需要能够在输入向量的单个条目中操作，但显然这破坏了自动梯度。我创建了这个简单的例子来展示我所面临的问题：def my_equation(x): return eq 谢谢!

浏览 2提问于2019-12-10得票数 0

回答已采纳

1回答

Pytorch深度学习类模型()和训练函数

python、oop、pytorch

我是Pytorch的新手，我正在学习本教程，以了解如何使用这个库进行深度学习。我在找出部分代码时遇到问题。有一个名为Net的类和一个名为model的对象从它实例化。然后是训练函数，称为train(epoch)。在列车函数体的下一行中，我看到了这个: model.train()，我不能理解它。你能帮我理解这部分代码吗？当一个类的方法还没有在类中定义时，我们如何调用

浏览 1提问于2019-12-13得票数 0

1回答

Tensorflow 1.10 TFRecordDataset -恢复TFRecords

python、tensorflow、python-3.6、tensorflow-datasets、tensorflow-estimator

然而，这些文档还有很多需要改进的地方，我已经看到了一些教程/博客(我已经看到了)，它们试图更深入，实际上只触及表面，或者重新散列现有的稀疏文档。对于在我的中考虑的演示数据--以及这里--我编写了一个不错的类，它需要：具有n个通道的序列(在本例中，它是基于整数的、长度固定且具有n个通道的序列)。软标记类概率(在本例中有n个类和基于浮点数的</

浏览 1提问于2018-08-28得票数 7

回答已采纳

1回答

自定义丢失函数的后端实现

python、machine-learning、neural-network、pytorch、backpropagation

我有一个有向量输出的神经网络Network。我不使用典型的损失函数，而是实现自己的损失函数，这是类中的一种方法。我关心的主要问题是渐变。由于我采用了自己的自定义损失函数，是否需要对成本函数实现自己的梯度？一旦我做了数学，我意识到，如果成本是J，那么J的梯度是一个相当简单的函数，就网络的最后一层的</e

浏览 1提问于2021-05-05得票数 1

回答已采纳

1回答

如何在nn.LSTM pytorch中进行R2评分

python、pytorch、lstm

我试着用R2in nn.LSTM做损失函数，但是我找不到任何关于它的文档。我已经使用了来自pytorch的RMSE和MAE loss。我的数据是一个时间序列，而我正在做时间序列预测。这是我在数据训练中使用RMSE损失函数的代码 model = LSTM_model(input_size=1, output_size=1, hidden_size=512, num_layers=2,loop_fn(mode, dat

浏览 741提问于2021-01-22得票数 0

回答已采纳

3回答

pytorch的验证损失更快-RCNN

python、machine-learning、computer-vision、pytorch、object-detection

我目前正在使用从pytorch预先训练的更快的RCNN模型(就像torchvision 中的模型)中的迁移学习在自定义数据集上进行对象检测。我可以在训练模式下运行model进行验证，如下所示：for images, targets in data_loader_val: val_loss_dict = model(images,

浏览 1提问于2020-02-21得票数 8

1回答

如何用pytorch评估和获得前馈神经网络的精度

python、neural-network、deep-learning、pytorch、linear-regression

我开始使用Pytorch，目前正在做一个项目，我正在使用一个简单的前馈神经网络进行线性回归。问题是，我在Pytorch中找不到任何可以让我获得Keras或SKlearn中线性回归模型的准确性的东西。在keras中，只需在编译函数中设置metrics=["accuracy"]即可。我在Pytorch的文档和官方网站上搜索了一下，但什么也没找到。这个API似乎不存在

浏览 16提问于2019-10-06得票数 1

1回答

RNN中填充和掩蔽序列的实现

python、rnn、pytorch

作为练习，我正在构建一个用于序列二进制分类的网络(序列是属于A型还是B型)。该网络由一个具有一个LSTM层的RNN组成，并在其之上形成一个输出分类的MLP。我将不同长度的序列批量输入到网络中，这意味着我需要对序列进行填充，使其长度相等，并屏蔽网络的输出，使它们与原始序列相同长度。在PyTorch中实现填充/掩蔽的正确方法是什么？我读过

浏览 0提问于2023-05-30得票数 0

2回答

如何在Tensorflow 2/keras自定义层中使用基于numpy的外部库函数？

deep-learning、neural-network、pytorch、tensorflow2.0、keras-layer

我正在尝试使用keras实现tensorflow 2中的自定义层(它是从类层派生的层)。在编写调用函数时，我需要从只接受numpy数组的外部库调用方法。这是一个相当复杂的函数，当然它不使用tensorflow函数。我的调用函数输入一个张量，将其转换为numpy (通过.numpy()函数)，从另一个库调用外部方法，然后将numpy数组转换回张量。如果

浏览 2提问于2020-10-23得票数 0

回答已采纳

2回答

计算机视觉变压器: ViT没有解码器吗？

computer-vision、transformer、attention-mechanism

v=TrdevFK_am4的一篇题为“图像值16X16字:用于图像识别的变形金刚”的论文那么ViT有一个更简单的体系结构？似乎编码器的输出是MLP的输入，用于分类任务。此外，为了学习的目的，我也被推荐到这个回购https://github.com/lucidra

浏览 0提问于2023-05-06得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云