PyTorch梯度不会流过张量的克隆_克隆张量Pytorch的梯度计算_如何在PyTorch中计算张量的梯度？ - 腾讯云开发者社区

python、pytorch

我正在尝试让我的模型学习某个特定的功能。我有可训练的参数self.a, self.b, self.c。我试图通过使用tanh来强制self.b在某个范围内。然而，当我运行代码时，它看起来像是渐变流经原始参数(self.b)，而不是流经克隆参数(self.b_opt) import torchimport torch.optim

浏览 10提问于2021-04-20得票数 1

回答已采纳

3回答

如何为PyTorch中的特定张量释放GPU内存？

pytorch

我目前正在使用PyTorch运行一个深度学习程序，并希望为特定的张量释放图形处理器内存。我想过像del和torch.cuda.empty_cache()这样的方法，但是del似乎不能正常工作(我甚至不确定它是否释放了内存)，torch.cuda.empty_cache()似乎释放了所有未使用的内存，但我只想为一个特定的张量释放内存。PyTorch中是否有提供此功能的功能？提前谢谢。

浏览 2提问于2019-11-19得票数 2

1回答

关于张量的子张量的Register_hook

pytorch

假设我们只想修改变量值的一部分的梯度，那么在pytorch中是否可以只对一个子张量进行register_hook (作为pytorch变量的张量的子张量)？

浏览 7提问于2019-04-30得票数 0

回答已采纳

1回答

自定义丢失函数的后端实现

python、machine-learning、neural-network、pytorch、backpropagation

我有一个有向量输出的神经网络Network。我不使用典型的损失函数，而是实现自己的损失函数，这是类中的一种方法。我关心的主要问题是渐变。由于我采用了自己的自定义损失函数，是否需要对成本函数实现自己的梯度？一旦我做了数学，我意识到，如果成本是J，那么J的梯度是一个相当简单的函数，就网络的最后一层的梯度而言。where the problem co

浏览 1提问于2021-05-05得票数 1

回答已采纳

4回答

PyTorch更喜欢复制张量

python、pytorch、copy、tensor

似乎有几种方法可以在PyTorch中创建张量的副本，包括根据我在执行b或d时得到的UserWarning，a和d显然更倾向于使用a。为什么它是首选的？表演？我认为它的可读性较低。使用c的任何理由/反对

浏览 2提问于2019-03-20得票数 142

回答已采纳

1回答

PyTorch中的Dict支持

machine-learning、deep-learning、pytorch

PyTorch是否支持类似dict的对象，通过这些对象我们可以反向传播梯度，比如PyTorch中的张量？我的目标是计算一个大型矩阵中的几个元素(1%)的梯度。但是如果我使用PyTorch的标准张量来存储矩阵，我需要将整个矩阵保存在我的GPU中，这会导致由于在训练期间可用的GPU内存有限而造成的问题。所以我在想

浏览 6提问于2022-03-08得票数 2

2回答

pytorch中的tensorflow stop_gradient等效项

tensorflow、pytorch

pytorch中的tf.stop_gradient()等价物是什么(提供了一种在反向传播过程中不计算某些变量的梯度的方法)？

浏览 70提问于2018-07-26得票数 8

1回答

pytorch如何计算简单函数的导数？

python、pytorch、autodiff

当我们讨论pytorch中的自微分时，我们通常会根据张量的公式得到张量的图形结构，pytorch将通过使用链规则跟踪图形树来计算梯度。但是，我想知道在叶节点上会发生什么？pytorch是用解析导数硬编码整个基本函数列表，还是使用数值方法计算梯度？一个简单的例子： return x ** 2 x = torch.tensor([1.0], req

浏览 19提问于2020-07-22得票数 3

1回答

对火炬张量的迭代

python、pytorch、iteration、tensor

什么是最好和最快的方式来迭代张量。令人费解的是，为什么我要得到张量而不是值。x in t]但却期望这样的行为t.numpy() ]如果可能的话，我宁愿不改做胖的？

浏览 2提问于2022-09-15得票数 2

回答已采纳

2回答

loss.backward()与模型的适当参数有何关系？

machine-learning、deep-learning、pytorch

我是PyTorch的新手，我很难理解loss是如何知道如何通过loss.backward()计算梯度的？当然，我知道参数需要有requires_grad=True，并且我知道它将x.grad设置为适当的梯度，以便优化器稍后执行梯度更新。当我有两个不同的

浏览 2提问于2019-11-14得票数 3

1回答

如何计算网络上部的梯度

deep-learning、pytorch、neural-network

我有一个简单的网络，像conv，→，conv，→线性的，我只有线性层的梯度，如何计算这两个conv层的梯度？我想知道，在拆分学习中，如果不使用损失或类似粉碎性数据之类的东西，是否有可能。

浏览 3提问于2022-11-25得票数 0

1回答

python在网络中与python计算代码的执行是否正确？

machine-learning、neural-network、deep-learning、computer-vision、pytorch

以下面的假代码为例： def forward(input): x = some_torch_layers(x) x = sum(x) # or numpy or other operations return x

浏览 0提问于2018-12-11得票数 0

回答已采纳

2回答

为什么我能够改变一个张量的值，而不知道计算图，在Pytorch中分离？

python、pytorch

我可以更改要求梯度的张量的值，而不需要自动梯度： import torch print(f'a_detached = {a_detached}')这不会造成任何错误。尽管如此，我能够改变a的内容，这是

浏览 4提问于2020-06-16得票数 1

回答已采纳

1回答

不计算参数的梯度

pytorch

b.grad) print(d.grad)NoneNone如何学习a和c的梯度

浏览 3提问于2019-10-16得票数 3

回答已采纳

1回答

重复某个张量的特定列

python、pytorch

我有一个大小为X m x n的pytorch张量和一个长度为n的非负整数num_repeats的列表(假设和(Num_repeats)>0)。在前进()方法中，我希望创建一个大小为X_dup的张量m x sum(num_repeats)，其中X的列i被重复num_repeats[i]时间。张量X_dup将在正向()方法的下游使用，因此需要正确地反求梯度。我可以想出的所有解决方

浏览 2提问于2019-12-07得票数 3

回答已采纳

1回答

使用PyTorch根据我从张量计算出的数字调整张量矩阵值？

python、machine-learning、pytorch、tensor、autograd

我已经初始化了两个张量(矩阵)： sm=Var(torch.randn(20,1),requires_grad=True)freq_m=Var(torch.randn(12,20),requires_grad=True) 我从这两个矩阵中的数据创建了两个列表，并使用spearmanr来获取这两个列表之间的相关值。我如何创建列表并不重要，但目标是调整矩阵内部的值，以便计算出的相关值尽可能接近1。如果我要手动解决这个问题，我每次都会通过.01 (或一些较

浏览 20提问于2019-08-24得票数 1

回答已采纳

2回答

如何将torch.inverse()函数PyTorch应用于批处理中的每个样本？

python、pytorch

这似乎是一个基本的问题，但我无法解决。在神经网络的前通过中，我有一个形状为8x3x3的输出张量，其中8是我的批次大小。我们可以假定每个3x3张量都是一个非奇异矩阵。我需要找到这些矩阵的逆。PyTorch 函数仅适用于方阵。既然我现在有8x3x3，如何以可微的方式将此函数应用于批处理中的每个矩阵？如果我迭代这些示例并将逆附加到python列表中，然后将其转换为PyTorch张量，那

浏览 23提问于2017-10-05得票数 10

1回答

PyTorch中的.data.size()和.size()有什么区别？

python、pytorch、size、tensor、torchvision

我是编程和ML的新手，我一直在尝试一些简单的数据集和神经网络架构。很多时候，我想检查我的数据和对象的维度，看看它们是否有意义。我已经在我正在做的一些简单的事情上对它们进行了测试，到目前为止它们给我的结果是一样的。有没有什么不同，只是我还没有遇到，还是它们是完全相同的？

浏览 256提问于2021-07-07得票数 0

1回答

有没有一种方法来监控优化器的步骤？

python、machine-learning、pytorch、optimizer-hints

考虑一下，您使用的是Pytorch优化器(如torch.optim.Adam(model_parameters) )。因此，在您的培训循环中，您将得到如下内容：# put the training loop here optimizer.step()是否有一种方法来监视您的优化器正在采取的步骤？以确保您不是在平面上，因此不采取任何步骤，因为<

浏览 3提问于2020-05-12得票数 1

回答已采纳

2回答

用requires_grad=False包装变量张量在遗留PyTorch中的应用

python、deep-learning、neural-network、pytorch

我使用的是2017/18年度编写的代码库，我发现了以下代码：audio_norm = torch.autograd.Variable(audio_norm, requires_grad=False) 我知道，Variable中的包装张量以前允许将它们的梯度合并到火炬以前版本的计算图中(现在不再需要)，但我不知道在torch.autograd.Variable(my_tensor, re

浏览 7提问于2022-05-04得票数 1

回答已采纳

点击加载更多