在PyTorch中使用requires_grad冻结图层与不向optim传递参数的区别

、

我想冻结编码器的参数以进行训练，因此只有解码器进行训练。我可以使用以下命令来完成此操作： # assuming it's a single layer called 'encoder' model.encoder.weights.data.requers_grad= False 或者，我可以只将解码器的参数传递给优化器。

浏览 49提问于2021-08-04得票数 1

回答已采纳

2回答

如何在不改变卷积层权重的情况下更新分类层

、、

我有一个CNN，里面有很多令人费解的层次。对于每一个卷积层，我都附加了一个分类器，以检查中间层的输出。在每个分类器产生损失后，我想更新分类器的权重，而不触及卷积层的权重。然而，我的分类器的形状是： nn.Linear(int(feature_map * input_shape[1] *True), nn.Linear(100, self.nu

浏览 6提问于2021-01-22得票数 0

回答已采纳

1回答

叶节点的requires_grad关系

、

来自这里的叶节点是什么意思？叶节点仅仅是输入节点吗？如果它只能在叶节点上改变，那我怎么能冻结层呢？

浏览 3提问于2017-07-04得票数 6

回答已采纳

2回答

model.train( False )与required_grad =False的区别

、、

我使用Pytorch库，我正在寻找一种方法使我的模型中的重量和偏差冻结。model.train(False) 有什么不同(如果有)，我应该使用哪一个冻结我的模型的当前状态

浏览 5提问于2020-08-24得票数 4

回答已采纳

6回答

loss.backward()和optimizer.step()之间的连接

、、、

optimizer和loss之间的显式连接在哪里？优化器如何知道在没有调用的情况下从哪里得到损失的梯度，比如这个optimizer.step(loss)当我将损失最小化时，我不必将梯度传递给优化器。

浏览 0提问于2018-12-30得票数 142

回答已采纳

1回答

如何将火炬损耗与模型参数连接起来？

、、、、

我知道在PyTorch中，优化器是通过在训练循环中，我们必须向后执行loss.backward()但是，损失是如何与模型参数相关联的呢？因为我们只定义优化器和模型之间的连接，而从不定义损失和模型之间的关联。当我们执行loss.backward()时，

浏览 8提问于2022-08-20得票数 0

1回答

如何在PyTorch中的前向传递中使用优化器

、、、

我希望在自定义函数的前通过中使用优化器，但它不起作用。= lambda y_star: (input + weight - y_star)**2 optimizer = torch.optim.Adam此外，我已经测试了优化之外的前进和它的工作，所以我想这是什么与上下文？根据文档“跟踪历史的张量参数(即使用requires_grad</e

浏览 3提问于2020-02-27得票数 0

1回答

Pytorch模型不更新权重

、

我试图用pytorch解决CartPole问题，但是在几次迭代之后，参数没有更新。 self.optimizer = torch.optim.Adamstate, q_values): output = sel

浏览 3提问于2019-10-10得票数 0

3回答

SGD优化器自定义参数

、、

我正在练习使用Pytorch，并尝试实现一个简单的线性模型。b = torch.randn(1, requires_grad=True) 我想使用梯度下降的a和b，并更新他们作为模型列车。sgd = torch.optim.SGD([a, b], lr=0.001, momentum=0.9, we

浏览 7提问于2022-08-31得票数 0

回答已采纳

1回答

如何在Pytorch中执行优化时应用变量的界？

、、、

我正在尝试使用Pytorch进行非凸优化，试图最大限度地实现我的目标(在SGD中最小化)。我希望绑定我的因变量x> 0，并且我的x值之和小于1000。我认为我的惩罚是正确的，以坡道惩罚的形式实现，但我正在与x变量的界限斗争。在Pytorch中，您可以使用clamp设置边界，但在这种情况下似乎不合适。我认为这是因为o

浏览 5提问于2019-12-05得票数 3

1回答

在Pytorch中注册模型参数的正确方法

、

我尝试在Pytorch中定义一个简单的模型。def forward(self, x):for _ in range(5): nll = model(torch.tens

浏览 50提问于2020-07-23得票数 2

回答已采纳

1回答

pytorch中load_state_dict与nn.Parameter加载模型参数的差异

、、

当我想要将部分预训练的模型参数分配给在新的PyTorch模型中定义的另一个模块时，我使用两种不同的方法得到了两种不同的输出。net模块中的classifier。这项任务使用了两种不同的方法。= nn.Parameter(params['classifier.3.bias'], requires_grad =F

浏览 87提问于2020-12-03得票数 1

1回答

发电机的优化器也训练鉴别器吗？

在学习GANs时，我注意到代码示例显示了以下模式：d_optim.zero_grad() d_loss = d_loss_fn()g_optim.zero_grad() g_loss = g_loss_fn(fake_pred, torch.ones))编写的，目的是防止d_optim.step()训练g，但是对于发电机<e

浏览 4提问于2020-03-20得票数 2

回答已采纳

1回答

我正在尝试用pytorch来“复制”，而且我还是个新手。我现在关心的是复制L_G (等式)。7第3页)，下面是我当前的代码： super(JSDLoss,self).f_num_features = f_real.size()[1] identity = autograd.Variable(torch.eye(f_num_features)*0.1, requires_grad但是，我怀疑这

浏览 4提问于2017-12-13得票数 3

1回答

.data在Pytorch1.3稳定版中仍然有用吗?它的意义是什么？

、

.data在Pytorch1.3稳定版中还在使用吗?如果是，你能和我分享一下参考资料吗？谢谢。t.data

浏览 6提问于2019-10-23得票数 0

回答已采纳

1回答

net.zero_grad() vs optim.zero_grad()

、

他们提到在训练参数梯度为零时需要包括optim.zero_grad()。我的问题是:我可以做同样的net.zero_grad()，这会有同样的效果吗？还是有必要做optim.zero_grad()。换句话说，做optim.zero_grad()和net.zero_grad()有什么区别。我问是因为他们使用net.zero_grad()，这是我第一次看到，这是一种强化学习算法的实现，在这种算法

浏览 1提问于2020-05-19得票数 15

回答已采纳

1回答

用Tensorflow实现随机神经网络？

、、、、

基于以下文献的具有随机权值的神经网络(NNRW) 本质上，其思想是，隐藏层是随机固定的，只对输出层进行优化。(导致一个简单的最小二乘解)。我很熟悉在keras中使用Sequential来创建模型，虽然我不确定我将如何“修复”隐藏层，并且只关注优化输出层。我的最后一次尝试是用NumPy手动编写网络代码，但我想问是否有人在Tensorflow中对此有任何想法

浏览 0提问于2022-04-06得票数 0

3回答

如何剥离一个预先训练的网络，并添加一些图层使用火把闪电？

、、

我试图将传输学习用于图像分割任务，我的计划是使用预训练模型(例如VGG16)的前几层作为编码器，然后添加我自己的解码器。因此，我可以通过打印来加载模型并查看结构：print(model)ResNet( (conv1): Conv2d(3, 64, kernel_si

浏览 5提问于2021-02-01得票数 0

2回答

如何在pytorch中连接2种电焊枪模型并使其第一种不可训练

、、

我有两个网络，我需要连接我的整个模型。然而，我的第一个模型是预先培训，我需要使它不能训练时，培训完全模式。如何在PyTorch中实现这一点。PATH)) x = torch.randn(1, 10)基本上，在这里，我想加载预先训练的modelA

浏览 0提问于2020-12-09得票数 4

回答已采纳

2回答

如何计算简单线性回归模型的梯度？

、、、、

我正在使用pytorch，并试图了解一个简单的线性回归模型是如何工作的。我使用的是一个简单的LinearRegressionModel类： def __init__(self, input_dimcriterion = nn.MSELoss() 最后，

浏览 3提问于2017-09-18得票数 5

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在不改变卷积层权重的情况下更新分类层

叶节点的requires_grad关系

model.train( False )与required_grad =False的区别

loss.backward()和optimizer.step()之间的连接

如何将火炬损耗与模型参数连接起来？

如何在PyTorch中的前向传递中使用优化器

Pytorch模型不更新权重

SGD优化器自定义参数

如何在Pytorch中执行优化时应用变量的界？

在Pytorch中注册模型参数的正确方法

pytorch中load_state_dict与nn.Parameter加载模型参数的差异

发电机的优化器也训练鉴别器吗？

如何在Pytorch中实现JSD损失上限？

.data在Pytorch1.3稳定版中仍然有用吗?它的意义是什么？

net.zero_grad() vs optim.zero_grad()

用Tensorflow实现随机神经网络？

如何剥离一个预先训练的网络，并添加一些图层使用火把闪电？

如何在pytorch中连接2种电焊枪模型并使其第一种不可训练

如何计算简单线性回归模型的梯度？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐