如何用pytorch打印出隐藏层梯度

原创

我爱自然语言处理

发布于 2018-05-31 15:07:39

11.9K00

代码可运行

文章被收录于专栏：我的python我的python

运行总次数：0

代码可运行

我们在训练神经网络时，有时会发现自己的网络学习不到东西，loss不下降或者下降很慢，这时除了检查修改学习率以外还有可能是碰见了梯度消失的问题。检查是否发生梯度消失最好的方法其实就是将梯度值打印出来，这里就讲讲如何在pytorch中打印出隐藏层的参数。

利用pytorch中register_hook函数可以打印出梯度，下面官方文档对这个函数的例子：

>>> v = Variable(torch.Tensor([0, 0, 0]), requires_grad=True)
>>> h = v.register_hook(lambda grad: grad * 2)  # double the gradient
>>> v.backward(torch.Tensor([1, 1, 1]))
>>> v.grad.data

在这个例子中，v是输入，这里计算的是v的梯度。如果要打印出隐藏层的梯度，则v应该是隐藏层的参数。那么接下来就是要选择出需要打印梯度的那一层的参数。

for item in net.named_parameters():
    if item[0] == 'fc.2.fc.weight':
        h = item[1].register_hook(lambda grad: print(grad))

net是之前建立的网络。net.named_parameters()方法返回的是一个tuple，即（name_str, parameters）。通过name_str来选择打印哪一层的参数，再对parameters调用register_hook方法即可打印出该层参数。在这里我打印的是第二个全连接层的参数的梯度。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

其他

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

其他

登录后参与评论

0 条评论

热度

如何用pytorch打印出隐藏层梯度

如何用pytorch打印出隐藏层梯度

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐