torch.autograd.grad中的grad_outputs (CrossEntropyLoss)

文章/答案/技术大牛

发布

1回答

、

第一个选项： loss.backward() inputs = x,grad_outputs = ?) 我的问题是:如果我使用交叉熵损失，我应该在第二个选项中传递什么作为grad_

浏览 196提问于2019-01-13得票数 5

回答已采纳

2回答

如何为多个输出编写参数？

、、

在“ of torch.autograd.grad”中指出，对于参数，输出(张量序列)-差异化函数的输出。输入(张量序列)-输入w.r.t.其中的梯度将被返回(而不是累积到.grad中)。我尝试以下几点：b = torch.rand(2, requires_grad=True)d = a-b torch.autograd.grad([c, d], [a, b]) #ValueError: only

浏览 2提问于2019-09-23得票数 5

回答已采纳

1回答

Pytorch:计算子矩阵梯度的正确方法

、

我想计算子矩阵上的梯度。torch.zeros((3, 5), requires_grad=True)print(f'full grad shape = {grad.shape}') grad = torch.autograd.grad(loss, A[:1, :])[0]print(f'grad shape = {grad.shape}'

浏览 0提问于2021-09-12得票数 0

1回答

如何在依赖于模型w.r.t输入的偏导数的情况下定义一个丢失函数？

、、

为了恢复现有的问题，如所示，它的目的是在区域-2 <= x <= 2中求解ODE y‘= -2*x*y，条件是y(x=0) =1，而不是使用有限差分，而是用n替换为y(x) = NN(x)。(y, x, create_graph=True, retain_graph=True)问题是，在ODE函数的定义中，我宁愿传递(x，y)之类的东西(其中乐趣是我的模型

浏览 0提问于2019-11-13得票数 2

回答已采纳

1回答

用自格法计算输出相对于输入的雅可比矩阵

、

如果这个问题是显而易见的或微不足道的，我很抱歉。我对pytorch非常陌生，我正在尝试理解py手电筒中的autograd.grad函数。我有一个神经网络G，它接收输入(x，t)和输出(u，v)。在每一个训练步骤中，我都有一个小批号$100$所以u(x，t)是一个100,1张量。下面是我计算偏导数的尝试，在这里，和弦是输入(x，t)，就像下面一样，我还将requires_grad_(True)标志添加到了同弦中： tensor = GeneratorNet(coords)

浏览 1提问于2019-12-03得票数 4

回答已采纳

1回答

grad_outputs在PyTorch's torch.autograd.grad中的意义

、

我很难理解grad_outputs选项在中的概念意义。 grad_outputs应该是包含Jacobian向量积中的“向量”的长度匹配输出序列，通常是预先计算的梯度w.r.t。每项产出。为什么“向量”在引号中？实际上，在下面的示例中，当grad_outputs是向量时，而不是当它是矩阵时，我得到了一个错误。.]], grad_fn=<MulBackward0>) >

浏览 5提问于2021-08-13得票数 5

回答已采纳

1回答

在PyTorch中从网络输出中计算梯度会产生误差

、、

我试图使用一个手动计算梯度使用我的网络输出，然后我将使用这个损失函数。我成功地获得了一个在keras中工作的示例，但是将它转换为PyTorch更困难。torch.unsqueeze(torch.linspace(-1, 1, 101), dim=1)然后，我可以尝试找到一个梯度，比如：grad = torch.autograd.grad，但是如果我将它更改为很多，它就表示它不是图形的一部分。我可以通过允许这样做来消除这个错误，但是它说我<

浏览 3提问于2020-12-22得票数 0

回答已采纳

1回答

Pytorch求和jacobian对输入而不是输出

、、、

通常，当我应用torch.autograd.grad(Y, X, grad_outputs=torch.ones_like(Y))时，我会得到一个与X相同形状的渐变掩模。(2)# X = [1 0]# Y = [1, 1] >>> torch.autograd.grad(Y, X, grad_outputs=torc

浏览 3提问于2021-08-30得票数 2

回答已采纳

1回答

丢失函数中带有torch.nn.DataParallel的torch.autograd.grad失败

、、、

为此，梯度是在损失函数中计算的(例如，梯度总是单位长度的符号距离字段(sdfs)的属性)。normal_constraint.mean() * 1e2,而梯度计算则使用torch.autograd.graddef gradient(y, x, grad_outputs=None):

浏览 10提问于2021-08-04得票数 2

1回答

用torch.autograd.grad* (PyTorch)计算矩阵导数*

、

我正在尝试使用torch.autograd.grad在PyTorch中计算矩阵导数，但是我遇到了一些问题。下面是一个重现错误的最小工作示例。torch.sin(theta), torch.cos(theta), 0]], torch.autograd.grad(outputs=rot_mat, inputs=theta, grad_outputs=torc

浏览 57提问于2020-08-16得票数 2

回答已采纳

1回答

PyTorch:用nn.parameters()计算Hessian向量积

使用PyTorch，我想计算Hessian向量乘积，其中Hessian是某个神经网络损失函数的二阶导数矩阵，该向量将是该损失函数的梯度向量。### compute the gradient and make a copy that is detached from the gr

浏览 0提问于2019-02-07得票数 2

1回答

如何计算向量函数的一个分量的偏导数？

、

, u[2])---> 19 grad_Psi_0 = torch.autograd.grad(psi[0], u[0]) 20 grad_Psi/.local/lib/python3.10/site-packages/torch/autograd/__init__.py:275, in grad(outputs, inputs, grad_outputs_vmap(vjp, 0, 0, allow_none_

浏览 79提问于2022-07-27得票数 0

回答已采纳

1回答

割炬梯度计算

、、

我正在努力弄清楚函数grad到底是如何工作的。).requires_grad_()print("A : ", A)do_dinput = torch.autograd.grad(o, A, grad_outputs=torch.ones(2, 1))我原以为torch.Size([1,3])会被打印

浏览 1提问于2020-01-27得票数 0

回答已采纳

2回答

Pytorch BERT输入梯度

、、、、

我正在试图从一个BERT模型中得到输入梯度。我怎么能这么做？假设，y‘= BertModel(x)。我正在寻找$d(loss(y，y'))/dx$

浏览 14提问于2022-09-16得票数 -1

1回答

当输入是3D时，“交叉熵损失”究竟在做什么？

、、、

我在研究一个产生文本的神经网络。我发现，当计算交叉熵损失时，如果输入的大小为[batch_size, vocab_size, seq_len]，目标的大小为[batch_size, seq_len]，那么无论我训练多久，该模型都不能工作所以我的问题是，当处理3D输入时，交叉熵损失到底在做什么？为什么第一种计算损失的方法在我的任务中行不通？

浏览 8提问于2022-09-12得票数 0

3回答

找不到就地运算:梯度计算所需的一个变量已被就地运算修改

、

我试图计算网络的雅可比矩阵的损失(即执行双反向支持)，得到以下错误: RuntimeError:梯度计算所需的一个变量已被原地操作修改 grad_output[:, i] = 1

浏览 1提问于2018-12-09得票数 2

回答已采纳

1回答

当使用代码torch.autograd.grad()时，每个时期的运行时间都在增加。

、、、

我使用torch.autograd.grad()函数来计算两个损失函数的梯度(用于平衡这两个损失的权重)，loss2_grads = torch.autograd.grad(loss2, model.parameters(), retain_graph=True)loss = loss1+alpha*loss2#alpha rel

浏览 4提问于2022-10-25得票数 -1

1回答

chainer向后函数中的参数"grad_outputs“是什么？

3个问题：在chainer函数F.transpose中的一个例子，如何解释这个反向代码？def向后(自，输入，grad_outputs)：gy = grad_outputs inv_axes = self.axes，如果self.axes: ax = tuple(ax % len(self.axesself.axes) inv_axes = tuple(numpy.argsort( axes )) gx = gy.transpose(i

浏览 1提问于2017-08-27得票数 0

1回答

在损失函数中使用自梯度时PyTorch不更新权重

、、

我试图使用网络的梯度相对于它的输入作为损失函数的一部分。然而，每当我试图计算它时，训练就会继续进行，但是权重不会更新。0] inputs=ic, grad_outputs

浏览 0提问于2020-10-24得票数 2

回答已采纳

4回答

具有多个值的张量的Bool值在Pytorch中是不明确的

、

它总是以一个以上的值返回的Bool值，实际上，我运行的是示例代码，它可以工作。loss = CrossEntropyLoss()inputtarget这是我的密码 ###############################################################

浏览 0提问于2018-10-23得票数 46

回答已采纳

点击加载更多