在第一个代码中,我使用第二个代码中的save_pretrained()函数上传了基于拥抱脸'transformers.trainer.Trainer‘的模型,我想下载这个上传的模型并使用它进行预测。我需要这一步的帮助-如何下载上传的模型,然后进行预测?
创建模型的步骤:
from transformers import AutoModelForQuestionAnswering, TrainingArguments, Trainer
model = AutoModelForQuestionAnswering.from_pretrained('xlm-roberta-large)
trainer = Trainer(
model,
args,
train_dataset=tokenized_train_ds,
eval_dataset=tokenized_val_ds,
data_collator=data_collator,
tokenizer=tokenizer,)
#Arguments used above not mentioned here - model, args, tokenized_train_ds, tokenized_val_ds, data_collator, tokenizer
#Below step train the pre-trained model
trainer.train()
然后,我使用下面的命令上传了这个'trainer‘模型:
trainer.save_model('./trainer_sm')
在不同的代码中,我现在想下载这个模型,并使用它进行预测,有人可以建议如何做到这一点吗?我尝试了下面的命令来上传它:
model_sm=AutoModelForQuestionAnswering.from_pretrained("./trainer_sm")
并使用它通过下面这行代码进行预测:
model_sm.predict(test_features)
AttributeError: 'XLMRobertaForQuestionAnswering' object has no attribute 'predict'
我也使用了'use_auth_token=True‘作为from_pretrained的参数,但也不起作用。
同样,type(培训者)是'transformers.trainer.Trainer‘,而type(model_sm)是transformers.models.xlm_roberta.modeling_xlm_roberta.XLMRobertaForQuestionAnswering
发布于 2021-10-21 18:03:36
您保存的是训练者将要调整的模型,您应该知道预测、训练、评估等是transformers.trainer.Trainer
object的实用程序,而不是transformers.models.xlm_roberta.modeling_xlm_roberta.XLMRobertaForQuestionAnswering
。根据前面提到的,保持运行的最简单方法是创建训练器的另一个实例。
model_sm=AutoModelForQuestionAnswering.from_pretrained("./trainer_sm")
reloaded_trainer = Trainer(
model = model_sm,
tokenizer = tokenizer,
# other arguments if you have changed the defaults
)
reloaded_trainer.predict(test_dataset)
https://stackoverflow.com/questions/69664125
复制相似问题