当我们讨论pytorch中的自微分时,我们通常会根据张量的公式得到张量的图形结构,pytorch将通过使用链规则跟踪图形树来计算梯度。但是,我想知道在叶节点上会发生什么?pytorch是用解析导数硬编码整个基本函数列表,还是使用数值方法计算梯度?一个简单的例子: return x ** 2
x = torch
我有一个有向量输出的神经网络Network。我不使用典型的损失函数,而是实现自己的损失函数,这是类中的一种方法。我关心的主要问题是渐变。由于我采用了自己的自定义损失函数,是否需要对成本函数实现自己的梯度?
一旦我做了数学,我意识到,如果成本是J,那么J的梯度是一个相当简单的函数,就网络的最后一层的梯度而言。where the problem co