PyTorch优化:在torch.tensor上使用map函数而不破坏计算图形是可能的吗？ - 腾讯云开发者社区

python、neural-network、pytorch、gradient-descent、autograd

我感兴趣的是找出神经网络输出相对于参数(权重和偏差)的梯度。更具体地说，假设我有如下的神经网络结构6,4,3,1。输入样本大小为20。我感兴趣的是找出神经网络输出的梯度w.r.t权重(和偏差)，如果我没有弄错的话，在这种情况下应该是47。在文献中，这种梯度有时被称为Weight_Jacobian。我在Jupyter Notebook上的Python 3.6上使用Pytorch版本0.4.0。我生成的代码是这样的： def init_params(layer_sizes, scale=0.1, rs=npr.RandomState(0)): return [(rs.randn(in

浏览 4提问于2018-05-04得票数 4

1回答

pytorch如何计算简单函数的导数？

python、pytorch、autodiff

当我们讨论pytorch中的自微分时，我们通常会根据张量的公式得到张量的图形结构，pytorch将通过使用链规则跟踪图形树来计算梯度。但是，我想知道在叶节点上会发生什么？pytorch是用解析导数硬编码整个基本函数列表，还是使用数值方法计算梯度？一个简单的例子： import torch def f(x): return x ** 2 x = torch.tensor([1.0], requires_grad=True) y = f(x) y.backward() print(x.grad) # 2.0 在这个例子中，pytorch是通过$$ (x^2)‘= 2x =2*1=2 $$

浏览 19提问于2020-07-22得票数 3

1回答

有没有办法确定PyTorch型号是在cpu上还是在设备上？

python、pytorch、gpu

我想弄清楚，PyTorch模型是在cpu上还是在cuda上，以便根据模型将其他变量初始化为Torch.Tensor或Torch.cuda.Tensor。然而，查看dir()函数的输出，我只看到.cpu()，.cuda()，to()方法，它们将模型放在设备上，图形处理器或其他设备上，在到中指定。对于PyTorch张量，有is_cuda属性，但没有对整个模型的模拟。有没有某种方法可以推断出模型的这一点，或者需要参考特定的权重？

浏览 6提问于2021-01-29得票数 1

1回答

在PyTorch中查找函数/类定义

python、pytorch、inspect

我想找出某些类和函数在PyTorch (和其他库)中定义的位置。不幸的是，以下方法不起作用： import inspect import torch inspect.getsource(torch.tensor) 它抛出以下错误： TypeError: module, class, method, function, traceback, frame, or code object was expected, got builtin_function_or_method 此外，在PyCharm中，我通常使用'gd‘(在vim模式下)来查找函数/类定义，但这对PyTorch也不起作

浏览 102提问于2021-04-13得票数 1

1回答

可以在一个GPU上一起训练pytorch和tensorflow模型吗？

tensorflow、tensorflow-gpu、pytorch

我有一个pytorch模型和一个tensorflow模型，我想在一个图形处理器上一起训练它们，按照下面的过程：input --> pytorch model--> output_pytorch --> tensorflow model --> output_tensorflow --> pytorch model。有可能做到这一点吗？如果答案是肯定的，我会遇到什么问题吗？提前谢谢。

浏览 5提问于2017-10-17得票数 5

1回答

如何将火炬损耗与模型参数连接起来？

python、machine-learning、neural-network、pytorch、backpropagation

我知道在PyTorch中，优化器是通过 optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate) 在训练循环中，我们必须向后执行，并通过执行这两行来更新梯度。 loss.backward() optimizer.step() 但是，损失是如何与模型参数相关联的呢？因为我们只定义优化器和模型之间的连接，而从不定义损失和模型之间的关联。当我们执行loss.backward()时，PyTorch如何知道我们将为我们的model做反向传播我把完整的代码放在这里作为上下文 import torch import torch.n

浏览 8提问于2022-08-20得票数 0

2回答

使用torch.no_grad()的目的是什么：

python、machine-learning、pytorch、linear-regression、gradient

考虑使用PyTorch实现线性回归的下列代码： X是输入，Y是训练集的输出，w是需要优化的参数。 import torch X = torch.tensor([1, 2, 3, 4], dtype=torch.float32) Y = torch.tensor([2, 4, 6, 8], dtype=torch.float32) w = torch.tensor(0.0, dtype=torch.float32, requires_grad=True) def forward(x): return w * x def loss(y, y_pred): return ((

浏览 27提问于2022-06-05得票数 4

1回答

为什么Pytorch autograd需要另一个向量来向后而不是计算雅可比？

python、optimization、pytorch、backpropagation、automatic-differentiation

要在Pytorch中执行backward，我们可以使用一个可选参数y.backward(v)来计算乘以v的雅可比矩阵 x = torch.randn(3, requires_grad=True) y = x * 2 v = torch.tensor([0.1, 1.0, 0.0001], dtype=torch.float) y.backward(v) print(x.grad) 我认为计算雅可比矩阵的成本是相同的，因为计算雅可比矩阵所必需的AD图中的每个节点仍然是计算的。那么为什么Pytorch不想给我们雅可比矩阵呢？

浏览 27提问于2020-09-10得票数 4

回答已采纳

1回答

加权均值和方差的更新

neural-network、pytorch、probability、bayesian、weight-initialization

我试着从论文神经网络中的权重不确定性的反推算法来理解贝叶斯，其思想是建立一个神经网络，其中每个权重都有它自己的概率分布。我明白这一理论，但我不明白如何更新学习部分的均值和方差。我在Pytorch中找到了一个代码，它简单地做到了： class BayesianLinear(nn.Module): def __init__(self, in_features, out_features): (...) # Weight parameters self.weight_mu = nn.Parameter(torch.Tensor(out_features, in_feature

浏览 0提问于2021-04-14得票数 1

4回答

在MacBook Pro上使用pytorch

macos、pytorch

我使用的是MacBook Pro (16英寸，2019年，macOS 10.15.5 (19F96)) GPU AMD Radeon Pro 5300 m Intel UHD Graphics 630 我正试着在我的mac上使用Pytorch和Cuda。我看到的所有指南都假设我有Nvidia图形卡。我发现了这个问题：问题，但是看起来我需要安装ROCm，根据他们的，它只支持Linux。是否可以使用mac和AMD图形卡在GPU上运行Pytorch？

浏览 10提问于2020-08-15得票数 9

1回答

如何在PyTorch中对独立于反向传播的独立函数使用自动梯度？

python、pytorch、gradient、autograd

我有两个变量，x和theta。我只想尽量减少对theta的损失，但作为损失函数的一部分，我需要一个关于x的不同函数(f)的导数。这个导数本身与最小化无关，只是它的输出。但是，在PyTorch中实现此操作时，我会得到一个运行时错误。最起码的例子如下： # minimal example of two different autograds import torch from torch.autograd.functional import jacobian def f(theta, x): return torch.sum(theta * x ** 2) def df(theta,

浏览 3提问于2021-11-12得票数 0

回答已采纳

1回答

如何填充一批文件？

pytorch

你好，PyTorch专家：句子和文档都可以变长。比方说，我们有以下两个文档： doc1=[torch.tensor([1,2,3,4]),torch.tensor([4,5,6]),torch.tensor([7,5])] doc2=[torch.tensor([1,2,3]),torch.tensor([4,5])] (在这里，每个张量是一个句子，张量中的每个数是嵌入矩阵的索引) doc1=pad_sequence(doc1,batch_first=True) doc2=pad_sequence(doc2,batch_first=True) batch=pad_sequence([do

浏览 0提问于2020-08-18得票数 1

1回答

用torch.autograd.grad (PyTorch)计算矩阵导数

pytorch、autograd

我正在尝试使用torch.autograd.grad在PyTorch中计算矩阵导数，但是我遇到了一些问题。下面是一个重现错误的最小工作示例。 theta = torch.tensor(np.random.uniform(low=-np.pi, high=np.pi), requires_grad=True) rot_mat = torch.tensor([[torch.cos(theta), torch.sin(theta), 0], [-torch.sin(theta), torch.cos(theta), 0]],

浏览 57提问于2020-08-16得票数 2

回答已采纳

1回答

具有浮点张量的Pytorch张量乘法给出错误的答案

pytorch

当我将两个pytorch张量相乘时，我看到了一些奇怪的行为。 x = torch.tensor([99397544.0]) y = torch.tensor([0.1]) x * y 下面的输出 tensor([9939755.]) 然而，答案应该是9939754.4

浏览 26提问于2019-09-18得票数 1

2回答

从浮点数字符串中获取torch.tensor

python、numpy、pytorch、tensor

我们可以将一维数组的浮点数转换为numpy数组或torch张量，如下所示。 line = "1 5 3 7 4" np_array = np.fromstring(line, dtype='int', sep=" ") np_array >> array([1, 5, 3, 7, 4]) 为了将上面的numpy数组转换为torch张量，我们可以执行以下操作： torch_tensor = torch.tensor(np_array) torch_tensor >>tensor([1, 5, 3, 7, 4]) 如何将由空

浏览 16提问于2020-05-10得票数 2

1回答

PyTorch: numpy.linalg.multi_dot()在PyTorch中的等价物是什么

python、numpy、pytorch、matrix-multiplication

我正在尝试在PyTorch中执行多个矩阵的矩阵乘法，并想知道在PyTorch中numpy.linalg.multi_dot()的等价物是什么？如果没有，那么在PyTorch中下一个最好的方法是什么(就速度和内存而言)？代码： import numpy as np import torch A = np.random.rand(3, 3) B = np.random.rand(3, 3) C = np.random.rand(3, 3) results = np.linalg.multi_dot(A, B, C) A_tsr = torch.tensor(A) B_tsr = tor

浏览 27提问于2020-10-25得票数 1

回答已采纳

2回答

Pytorch RuntimeError:张量的元素0不需要grad，也没有grad_fn

python、deep-learning、pytorch、gradient、reinforcement-learning

这段代码是这样构建的:我的机器人拍了一张照片，一些tf计算机视觉模型计算出目标物体在图片中的开始位置。该信息(x1和x2坐标)被传递给pytorch模型。它应该学会预测正确的运动激活，以便更接近目标。执行移动后，机器人再次拍照，tf cv模型应计算电机激活是否使机器人更接近所需状态( 10处的x1，at31处的x2坐标) 但是，每次我运行代码pytorch都不能计算渐变。我想知道这是不是一个数据类型的问题，或者是一个更一般的问题:如果不是直接从pytorch网络的输出计算损失，是否不可能计算梯度？我们将非常感谢您的帮助和建议。 #define policy model (model to

浏览 0提问于2020-05-15得票数 6

1回答

为什么“张量”变量占用的内存如此小？

python、numpy、pytorch、tensor、numpy-ndarray

在Pytorch 1.0.0中，我发现tensor变量占用了很小的内存。我想知道它怎么会存储这么多数据。这是密码。 a = np.random.randn(1, 1, 128, 256) b = torch.tensor(a, device=torch.device('cpu')) a_size = sys.getsizeof(a) b_size = sys.getsizeof(b) a_size是262288。b_size是72岁。

浏览 0提问于2019-01-25得票数 22

回答已采纳

1回答

使用pytorch进行边界优化

optimization、pytorch、tensor、constraint-programming

如何在pytorch中使用优化方法时包含边界。我有一个变量的张量，每个变量都有不同的界限。 upper_bound = torch.tensor([1,5,10], requires_grad=False) lower_bound = torch.tensor([-1,-5,-10], requires_grad=False) X = torch.tensor([10, -60, 105], require_grad=True) for _ in range(100): optimizer.zero_grad() loss = .. loss

浏览 0提问于2021-03-11得票数 0

1回答

稍微调整一下Pytorch中加权L1损失的L1损失，梯度计算还能正常工作吗？

python、pytorch

我在Pytorch中实现了一个神经网络，我想使用加权的L1损失函数来训练网络。具有常规L1损失的实现包含每个时期的以下代码： optimiser.zero_grad() net.train() _,forecast = net(torch.tensor(feature, dtype=torch.float).to(DEVICE)) loss = F.l1_loss(forecast, torch.tensor(target,dtype=torch.float).to(DEVICE),reduction='mean') loss.backward() para

浏览 46提问于2019-10-02得票数 2

回答已采纳

1回答

两个n维Pytorch张量的不相交

python-3.x、algorithm、pytorch、intersection

提前感谢大家的帮助！我在PyTorch中尝试做的是计算许多维的张量的非交集(让我们称之为torch.nonintersection) (没有for循环，因为我希望它能在GPU上有效地执行)。下面是它的工作原理示例： a = torch.tensor([[ 0., 0.], [ 0., 1.], [ 0., 2.], [ 1., 0.], [ 1., 1.], [ 1., 2.], [ 1., 3.], [ 2., 0.], [ 2., 1.], [ 2., 2.]]) b = torch.tensor([[ 2., 0.], [ 2

浏览 14提问于2020-07-08得票数 1

回答已采纳

1回答

当未设置-- GPU时，防止在SLURM中使用GPU

pytorch、slurm

我们正在使用SLURM来管理一个小型的内部集群。我们管理的一个关键资源是GPU。当用户通过--gpus=2请求GPU时，SLURM分配给用户的GPU设置为CUDA_VISIBLE_DEVICES环境变量。 $ srun --gpus=2 bash -c 'echo $CUDA_VISIBLE_DEVICES' 0,1 我们有一个小团队，可以相信我们的用户不会滥用系统(他们可以很容易地覆盖环境变量)，所以这很好用。然而，意外地绕过这一点太容易了，因为当--gpus没有被指定时，$CUDA_VISIBLE_DEVICES是未设置的，这样用户就可以使用任何图形处理器(我们通常使用Py

浏览 89提问于2019-08-23得票数 5

回答已采纳

1回答

Pytorch geometric:如何解释以下代码片段中的输入？

python、machine-learning、pytorch、data-science、pytorch-geometric

我正在https://pytorch-geometric.readthedocs.io/en/latest/notes/introduction.html上阅读PyTorch几何文档在这个页面上，有一个代码片段： import torch from torch_geometric.data import Data edge_index = torch.tensor([[0, 1, 1, 2], [1, 0, 2, 1]], dtype=torch.long) x = torch.tensor([[-1], [0], [1]], dty

浏览 31提问于2021-09-05得票数 1

回答已采纳

3回答

将列表和标量列表转换为PyTorch张量列表会引发警告

python、pytorch、warnings、tensor

我正在将一个列表转换为一个PyTorch张量，并得到了一个警告消息。转换本身并不困难。例如： >>> import torch >>> thing = [[1, 2, 3, 4, 5], [2, 3], 2, 3] >>> thing_tensor = list(map(torch.tensor, thing)) 我收到警告： home/user1/files/module.py:1: UserWarning: To copy construct from a tensor, it is recommended to use sourceT

浏览 1提问于2020-08-03得票数 0

回答已采纳

1回答

Pytorch autograd:使一个参数的梯度成为另一个参数的函数

pytorch、autograd

在Pytorch中，如何使参数的梯度本身成为函数？下面是一个简单的代码片段： import torch def fun(q): def result(w): l = w * q l.backward() return w.grad return result w = torch.tensor((2.), requires_grad=True) q = torch.tensor((3.), requires_grad=True) f = fun(q) print(f(w)) 在上面的代码中，我如何使f(w)关于q有梯

浏览 21提问于2020-11-10得票数 1

回答已采纳

3回答

了解PyTorch中的反向传播

python、deep-learning、neural-network、pytorch、backpropagation

我正在探索PyTorch，但我不理解以下示例的输出： # Initialize x, y and z to values 4, -3 and 5 x = torch.tensor(4., requires_grad = True) y = torch.tensor(-3., requires_grad = True) z = torch.tensor(5., requires_grad = True) # Set q to sum of x and y, set f to product of q with z q = x + y f = q * z # Compute the deriv

浏览 2提问于2021-09-28得票数 3

2回答

求损失函数中的张量值

tensorflow、keras、deep-learning、theano、pytorch

我想得到这个的y_pred和y_true张量的值。我需要这能够执行一些自定义计算和改变损失，这些计算是可能的，与实际的数组值。 def mean_squared_error(y_true, y_pred): #some code here return K.mean(K.square(y_pred - y_true), axis=-1) 有办法在角星上这样做吗？或者在其他的ML框架中(tf，pytorch，theano)？

浏览 5提问于2018-08-17得票数 0

回答已采纳

1回答

PyTorch:有可能区分一个矩阵吗？

python、pytorch、differentiation

如何在PyTorch中区分矩阵？我尝试过以下几种方法，但都不起作用：实例1： a = torch.tensor([1., 2, 3], requires_grad=True) b = torch.tensor([4., 5, 6], requires_grad=True) c = a*b c.backward() #print(b.grad) >>> RuntimeError: grad can be implicitly created only for scalar outputs 实例2： a = torch.tensor([1., 2, 3], requires

浏览 4提问于2020-07-26得票数 2

1回答

pytorch gesv给出了与scipy稀疏求解不同的结果。

python、scipy、pytorch

我试图在pytorch中实现减法，这样我就可以在我的图形处理器上运行它，但我遇到了问题，因为pytorch.gesv给出的结果与scipy.linalg.spsolve不同。下面是我的scipy代码： def baseline_als(y, lam, p, niter=10): L = len(y) D = sparse.diags([1,-2,1],[0,-1,-2], shape=(L,L-2)) w = np.ones(L) for i in range(niter): W = sparse.spdiags(w, 0, L, L) Z = W + lam

浏览 4提问于2018-09-11得票数 1

2回答

如何将PyTorch sigmoid函数变为更陡峭的函数

python、pytorch、sigmoid

当我使用torch.sigmoid时，我的模型可以工作。我试图通过创建一个新的sigmoid函数来使sigmoid变得更陡峭： def sigmoid(x): return 1 / (1 + torch.exp(-1e5*x)) 但是由于某种原因，渐变并没有流过它(我得到的是NaN)。我的函数是否有问题，或者有没有办法简单地将PyTorch实现更改为更陡峭(像我的函数一样)？代码示例： def sigmoid(x): return 1 / (1 + torch.exp(-1e5*x)) a = torch.tensor(0.0, requires_grad=True) b =

浏览 263提问于2021-04-22得票数 2

回答已采纳

1回答

pytorch python中无法使用多目标损失函数

python、deep-learning、neural-network、pytorch、loss-function

我无法在pytorch中对多标签分类使用损失函数这是我的损失函数： def loss(self,pred,y_true): pred = torch.tensor(pred) y_true = torch.tensor(y_true) loss = nn.NLLLoss()(torch.log(pred), y_true) return loss 在试图获得损失时： model.loss(model(xtrain),ytrain) 它显示一个错误： RuntimeError: 1D target tensor expected, multi-target

浏览 6提问于2021-09-24得票数 0

1回答

PyTorch中的按聚合积分组

python、pytorch、tensor

我和有同样的问题。但是，我希望在每个组(或标签)中创建我的张量的产品。不幸的是，我找不到一个本机PyTorch函数来解决我的问题，就像产品的假设scatter_prod_ (和等效于scatter_add_ )一样，这是中使用的函数。从的问题中回收示例代码，考虑2D张量： samples = torch.Tensor([ [0.1, 0.1], #-> group / class 1 [0.2, 0.2], #-> group / class 2 [0.4, 0.4], #-> group / class 2 [0.0, 0

浏览 39提问于2022-12-02得票数 1

4回答

PyTorch更喜欢复制张量

python、pytorch、copy、tensor

似乎有几种方法可以在PyTorch中创建张量的副本，包括 y = tensor.new_tensor(x) #a y = x.clone().detach() #b y = torch.empty_like(x).copy_(x) #c y = torch.tensor(x) #d 根据我在执行b或d时得到的UserWarning，a和d显然更倾向于使用a。为什么它是首选的？表演？我认为它的可读性较低。使用c的任何理由/反对

浏览 2提问于2019-03-20得票数 142

回答已采纳

1回答

分单元计算打破了自格法

python-3.x、machine-learning、pytorch、logistic-regression

我正在使用pytorch来计算逻辑回归的损失(我知道pytorch可以自动完成这个任务，但我必须自己来完成)。下面定义了我的函数，但是对torch.tensor的强制转换打破了自动梯度，给出了w.grad = None。我不熟悉火把，所以我很抱歉。 logistic_loss = lambda X,y,w: torch.tensor([torch.log(1 + torch.exp(-y[i] * torch.matmul(w, X[i,:]))) for i in range(X.shape[0])], requires_grad=True)

浏览 1提问于2019-02-06得票数 1

回答已采纳

2回答

对于较大的交叉或外部产品，NumPy比PyTorch更快

python、numpy、optimization、pytorch、cross-product

我正在计算(50500,)大小向量之间的巨大外积，发现NumPy是(多？)这样做比PyTorch更快。以下是测试结果： # NumPy In [64]: a = np.arange(50500) In [65]: b = a.copy() In [67]: %timeit np.outer(a, b) 5.81 s ± 56.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each) ------------- # PyTorch In [73]: t1 = torch.arange(50500) In [76]: t2

浏览 2提问于2019-01-25得票数 3

1回答

如何在DeepLearning4J的图形处理器上创建ND4J NDArrays？

java、pytorch、deeplearning4j、dl4j

有没有办法在DL4J中创建NDArrays，这样操作就可以在GPU上完成？例如在pytorch中， cuda0 = torch.device('cuda:0') x = torch.tensor([1., 2.], device=cuda0) 如果我的系统配备了图形处理器，我无法找到指定后端(cpu或gpu)的方法？

浏览 17提问于2020-07-01得票数 0

1回答

当预测已经有可能时，毕火炬进行交叉熵损失。

neural-network、loss-function、probability、pytorch、softmax

因此，通常可以使用PyTorch中的交叉熵损失函数来应用范畴交叉熵，或者将logsoftmax与负日志相似函数结合起来，例如： m = nn.LogSoftmax(dim=1) loss = nn.NLLLoss() pred = torch.tensor([[-1,0,3,0,9,0,-7,0,5]], requires_grad=True, dtype=torch.float) target = torch.tensor([4]) output = loss(m(pred), target) print(output) 问题是。如果输出处的数据已经处于具有概率的状态，而变量pred已

浏览 0提问于2019-07-18得票数 3

回答已采纳

1回答

在PyTorch中计算标量和向量之间的梯度

pytorch、theano

我正在尝试将使用Theano编写的代码复制到PyTorch。在代码中，作者使用以下命令计算梯度 import theano.tensor as T gparams = T.grad(cost, params) gparams的形状是(256, 240) 我试过使用backward()，但它似乎没有返回任何东西。在PyTorch中有没有等同于grad的东西？假设这是我的输入， import torch from torch.autograd import Variable cost = torch.tensor(1.6019) params = Variable(torch.ran

浏览 26提问于2019-10-17得票数 0

2回答

PyTorch数据自动化系统的版本总是10.2

python、linux、pytorch

我安装了几个PyTorch版本(CUDA 11.7 nightly、CUDA 11.6 nightly、11.3)，但每次torch.version.cuda都返回10.2。我想在CUDA 11.7上运行PyTorch。我的显卡有CUDA功能sm_86。 [me@legion imagen-test]$ sudo pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113 ... [me@legion imagen-test]$ python >&

浏览 30提问于2022-05-29得票数 2

回答已采纳

1回答

PyTorch:为什么运行output =model(映像)需要这么多GPU内存？

python、machine-learning、pytorch、gpu

在试图理解为什么我的PyTorch模型的最大批处理大小是有限的时，我注意到使用最多内存的不是模型本身，也不是将张量加载到GPU中。当第一次生成预测时，大部分内存都会耗尽，例如训练循环中的以下一行： output = model(images) 其中图像是一些输入张量，模型是我的PyTorch模型。在运行该行之前，我有大约9GB的GPU内存可用，然后我降低到2.5GB (在运行loss = criterion(outputs, labels)之后，它进一步下降到1GB可用)。两个问题：这是正常的吗？为什么会这样？那些记忆是用来做什么的？据我所知，模型已经加载，在进行调用之前，实际的

浏览 3提问于2022-05-27得票数 4

回答已采纳

1回答

在TensorFlow2.0中，`Tensor.grad`的等效语法是什么

python、pytorch、tensorflow2.0、gradient

在Pytorch中，我们可以通过以下方式访问变量x的梯度 z.grad 在Tensorflow 2中相同的语法是什么？我的目标是减少梯度。以下是Pytorch代码 if z.grad > 1000: z.grad = 10 tensorflow 2可以应用相同的功能吗？谢谢

浏览 23提问于2020-12-25得票数 1

回答已采纳

1回答

Pytorch中的切片给出了错误的答案

python、pytorch

当我运行以下代码行时，我看到了以下我无法解释的结果。我期望看到1.，2.作为a*x:,0的答案，实际上如果我在numpy中做同样的事情，我会得到这个答案，但我不知道为什么pytorch会给我一个不同的答案： >>> x = torch.tensor([[1,0],[1,1]]) >>> a = torch.tensor([1.,2.]) >>> a*x tensor([[1., 0.], [1., 2.]]) >>> a*x[:,0] tensor([1., nan])

浏览 0提问于2019-12-02得票数 0

1回答

TypeError: backward()在pytorch中获得意外的关键字参数“grad_tensors”

python-3.x、pytorch、gradient

我有以下几点 w = torch.tensor([1.], requires_grad=True) x = torch.tensor([2.], requires_grad=True) a = torch.add(w, x) b = torch.add(w, 1) y0 = torch.mul(a, b) # y0 = (x+w) * (w+1) y1 = torch.add(a, b) # y1 = (x+w) + (w+1) loss = torch.cat([y0, y1], dim=0) # [y0, y1] weight = torch.

浏览 80提问于2020-12-09得票数 2

回答已采纳

1回答

Pytorch:当就地操作遵循某些函数时，梯度计算会失败。

python、deep-learning、pytorch

请考虑以下代码： import torch from torch import nn a = torch.tensor([1.], requires_grad=True) b = nn.Tanh()(a) # b = nn.Linear(1,1)(a) b *= 1 # b = b * 1 b.sum().backward() 在RuntimeError中运行代码将得到以下结果： RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation

浏览 4提问于2021-07-05得票数 0

1回答

PyTorch & Numpy中的张量项选择逻辑发散性

python、numpy、pytorch

描述我正在设置一个torch.Tensor用于掩蔽目的。在尝试按索引选择条目时，事实证明，使用numpy.ndarray和torch.Tensor保存索引数据的行为是不同的。我希望能够访问这两个框架中的设计和解释差异的相关文档。复制步骤环境来自官方版本的容器中的Pytorch1.3：pytorch/pytorch:1.3-cuda10.1-cudnn7-devel 示例假设我需要使用shape [3,3,3]将mask设置为torch.Tensor对象，并将条目(0,0,1) & (1,2,0)中的值设置为1。下面的代码解释了这种差异。 mask = torch.zeros

浏览 11提问于2020-01-15得票数 2

回答已采纳

1回答

为什么放火器不能计算循环中的梯度？

python、machine-learning、deep-learning、pytorch、gradient

我遇到了一个问题，但我不知道为什么。首先，我用torch.tensor()创建了一个张量，我的目标是计算y=2*x的梯度，它最初是通过设置参数requires_grad = True来完成的。我运行了y.backward()，它成功了。我认为上面提到的步骤是模式。我想看看这个模式是否适用于向量a中的每个元素，所以我写了for -循环，但是新的步骤返回的不是张量(2)。我试着把每一个我都从循环中分离出来，就像在图片中一样，它起了作用。我很困惑。请告诉我为什么。非常感谢! import torch x = torch.tensor([1.0,2.0,3.0,7.0],requires_gra

浏览 3提问于2022-04-11得票数 0

1回答

当标签的维度与PyTorch中神经网络输出层的维度不同时会发生什么？

machine-learning、neural-network、pytorch

对我来说，标签的维度应该与神经网络最后一层的维度相同，这对我来说是有直觉的。然而，通过一些使用PyTorch的实验，它以某种方式被证明是有效的。代码： import torch import torch.nn as nn X = torch.tensor([[1],[2],[3],[4]], dtype=torch.float32) # training input Y = torch.tensor([[2],[4],[6],[8]], dtype=torch.float32) # training label model = nn.Linear(1,3) learning_rate

浏览 234提问于2021-07-30得票数 1

2回答

如何编写自定义CrossEntropyLoss

neural-network、pytorch、logistic-regression、cross-entropy

我正在Pytorch中学习Logistic回归，为了更好地理解，我定义了一个定制的CrossEntropyLoss，如下所示： def softmax(x): exp_x = torch.exp(x) sum_x = torch.sum(exp_x, dim=1, keepdim=True) return exp_x/sum_x def log_softmax(x): return torch.exp(x) - torch.sum(torch.exp(x), dim=1, keepdim=True) def CrossEntropyLoss(outputs

浏览 5提问于2019-10-13得票数 1

回答已采纳

3回答

寻找两个pytorch张量的不交

python、numpy、pytorch

提前感谢大家的帮助！我在PyTorch中尝试做的事情类似于numpy的setdiff1d。例如，给定以下两个张量： t1 = torch.tensor([1, 9, 12, 5, 24]).to('cuda:0') t2 = torch.tensor([1, 24]).to('cuda:0') 预期输出应为(已排序或未排序)： torch.tensor([9, 12, 5]) 理想情况下，这些操作是在GPU上完成的，而不是在GPU和CPU之间来回进行。非常感谢！

浏览 43提问于2019-03-12得票数 11

回答已采纳

1回答

Tensorflow迭代器返回元组的问题

python、numpy、tensorflow、tuples、tensorflow-datasets

我想迭代TF数据集，以便将获得的数据转换为numpy张量。作为tensorflow的新手，我的代码如下所示 def convert_dataset_to_pytorch(self, dataset): sess = tf.Session(config=self.config) iterator = dataset.make_one_shot_iterator() exampleTF, labelsTF = iterator.get_next() examples = torch.Tensor() labels = torch.Tensor()

浏览 42提问于2019-05-09得票数 0

回答已采纳