pytorch.load和保存-尝试继续训练时加载state_dict时出错

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、、、

我得到以下错误：RuntimeError: Error(s) in loading state_dict for XceptionHourglass: Missing key(s) in state_dictweight", "conv2.bias", "bn2.weight", "bn2.bias", "bn2.running_mean", "bn2.running_var"....., 我通过以下方式开始训练我想加载</

浏览 166提问于2021-10-10得票数 0

1回答

RuntimeError:为BertModel加载state_dict时的错误

、、、

我制作了一个BERT模型，使用拥抱面部变压器库，并在GPU中在云中进行训练。然后保存模型和令牌程序，如下所示：torch.save(best_model.state_dict(), '/saved_model然后，在我的计算机中加载模型/令牌器，如下所示from transformers import * tokenizer = BertToken

浏览 5提问于2019-10-18得票数 1

2回答

如何在几天内训练神经网络？

、、

我需要训练一个CNN，这将需要1-2天来训练一个远程访问的GPU服务器。我是否只需要让我的笔记本电脑通宵开着就可以完成培训，或者有没有办法保存培训的状态并在第二天从那里恢复？

浏览 15提问于2018-07-26得票数 0

1回答

为什么我得到不同的结果后保存和加载模型重量在火把？

、、

，并与单独训练和评价的子模块进行比较，取得了较好的效果。我在我的时代循环中使用了一种早期停止技术来保存最好的参数。经过训练，我创建了同一个类的一个新实例，当我加载保存的“最佳”参数时，我没有得到类似的结果。我单独对每个子模块(RNN和CNNText )进行了相同的尝试，它起了作用。但在这种情况下，它并没有提供相同的表现。我加载

浏览 0提问于2019-04-29得票数 1

1回答

State_dict中的意外键：“模型”，“选择”

、、、

我目前正在使用fast.ai来训练图像分类器模型。state_dict中的错误：# original saved file with DataParallelState_dict中的意外键："“。我正在使用Google来训练我

浏览 3提问于2019-03-07得票数 1

回答已采纳

2回答

如何在其他地方使用bert预训练模型？

、、、、

我遵循了这门课程，是关于为情感分析构建一个预先训练的模型。在训练期间，在每个时期，他们使用torch.save(model.state_dict(), f'BERT_ft_epoch{epoch}.model')保存模型。但我不知道如何加载模型和预测，这是我尝试过的：import torch model = models.resnet101(pretrained

浏览 41提问于2020-07-16得票数 1

1回答

加载的PyTorch模型与保存的模型有不同的结果

我有一个python脚本，它训练然后测试CNN模型。模型的权重/参数经测试后通过以下方法保存：torch.save(checkpoint, path + filename) model_load = create_model(cnn_type问

浏览 11提问于2022-03-01得票数 2

回答已采纳

1回答

如何通过pytorch读取我学习到的权重的.ckpt文件来使用resnet

、、、、

在pytorch中，我如何编写加载.ckpt文件的代码，而不是下面是我的尝试 Missing key(s) in state_dict: "conv1.weightUnexpected key(s) in state_dict: "epoch&q

浏览 335提问于2021-06-03得票数 1

2回答

保存pytorch模型并将其加载到新文件中

、、

我已经让这个程序开始工作了，但是每次我运行这个程序时，它都得重新训练。我想训练这个模型，保存它，然后每次我想要运行这个程序时，使用经过训练的模型运行一个单独的文件。这将节省很多时间，因为训练大约需要40分钟。然后，我尝试将model_hybrid模型保存到一个文件中，以便在不同的python会话中打开它： torch.save(model_hybrid.state_dict(),r'C:\Users\chase当我试图用以下代码加载保

浏览 14提问于2022-08-02得票数 0

1回答

如何清除图形卡内存后，培训后，在火把？

、、

我在实验室处理火把经过培训，我保存了模型，并将模型加载到另一个笔记本(注2)。在注释2中，在加载state_dict和所有内容之后，pytorch消耗的内存要比训练状态少得多。因此，我怀疑“无用”数据是存储在图形卡内存中，而培训(在我的例子中，大约13 So ).我试着删除训练时使用的变量，但是不够大(大约2gb)

浏览 0提问于2020-12-08得票数 1

回答已采纳

1回答

没有火炬视觉的放火器负载模型

、、

是否有可能(从包含.pth文件的architecture+state_dict文件中加载)而不将torchvision作为依赖项加载？

浏览 7提问于2021-08-17得票数 0

回答已采纳

1回答

如何加载和使用PyTorch (.pth.tar)模型

、、、、

然而，我需要使用重新训练的开始模式，这是在火炬的再培训。由于重新培训特定应用程序的初始模型所需的大量计算资源，我想使用已经重新培训过的模型。这似乎是可行的，因为print(model)输出了大量的数字和其他值

浏览 0提问于2018-08-15得票数 10

1回答

用strict=False在PyTorch中加载一个改进的预训练模型

、、、

我想使用预先训练的模型作为我的模型中的编码器部分。def forward(self, x): a, b = self.encoder(x)由于我修改了这个预训练模型的部分代码，基于，我需要应用strict=False以避免出现错误，但是根据我加载预训练权重的场景，我无法在代码中找到应用strict=False的位置。如何应用它，或者如何更改加载经过预先训练的模型的场景，taht使应用strict=False成为可能

浏览 18提问于2022-07-24得票数 3

回答已采纳

3回答

我试图理解神经网络训练中的“时代”。下一个实验是否等效？

、、、、

为了不创建任何夫人，让我们说，我介绍了最初的权重和偏差的‘模型’。我用训练样本和训练标签来训练40个时代的“模型”。经过训练，神经网络将对整个神经网络有一组特定的权重和偏差，我们称之为WB_Final_experiment1。我用训练样本和训练标签来训练20个时代的“模型”。经过训练，神经网络将对整个神经网络有一组特定的权重和偏差，我们称之为

浏览 13提问于2020-03-20得票数 3

回答已采纳

1回答

在火炬训练中重新设定学习速度

、、

为了降低学习率的价值，我在Pytorch中使用学习速率调度器来训练一个模型。通过使用学习速率调度器，我将学习速度从0.0001降至1e-5，并将所有的权重、参数、学习速率值等保存在特定的检查点上。现在，我想恢复训练的模式，但是有不同价值的学习率，而剩下的所有其他价值。我该怎么做？这是保存检查点的代码。checkpoint = { 'val_loss_min': val_loss['total'

浏览 14提问于2022-06-12得票数 0

回答已采纳

1回答

如何加载部分预训练的pytorch模型？

、、、、

我正在尝试让pytorch模型运行在句子分类任务上。如何从ClinicalBert模型加载预训练的Bert权重，而不加载分类权重？天真地尝试从预先训练的ClinicalBert权重中加载权重时，我得到了以下错误： size mismatch for classifier.weight: copying a param with shape我目前尝试替换pytorch_pretrained_bert包中的from_pretrained函

浏览 94提问于2020-04-14得票数 6

10回答

如何在PyTorch中保存经过训练的模型？

、、、、

如何在PyTorch中保存经过训练的模型？我读到过： /用于保存/加载模型状态。

浏览 18提问于2017-03-09得票数 346

回答已采纳

1回答

是否可以加载用model.module.state_dict()存储但用model.state_dict()加载的模型？

、

我想问一个问题，我已经用两个gpu训练了一个模型，并用model.module.state_dict()存储了这个模型，现在我想用一个gpu加载这个模型，我可以用model.state_dict()直接加载这个训练过的模型吗

浏览 459提问于2021-05-24得票数 0

1回答

如何在pytorch上节省训练模型的重量？

、、

我可以进行训练，但不能保存模型的权重。我一直收到“ran of input”错误。有什么解决方案吗？her epoch için yazdırdık checkpoint = { print("=> Loading checkpoint") model.load_state_dic

浏览 1提问于2021-02-22得票数 0

3回答

如何选择使用lambda函数的任意py手电筒模型？

、、

def forward(self, x): return out with open(ckpt_path_plus_path , 'ab') as db_file:目前，它没有抛出

浏览 5提问于2020-04-29得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云