我想下载一个预先训练过的模型,并用我自己的数据对模型进行微调。我已经下载了一个伯特-大纳模型文物从拥抱脸,我已经列出了以下内容。对于这一点,我想知道我需要哪些文件或工件,从外观上看,pytorch_model.bin是经过训练的模型,但这些其他文件是什么以及它们的用途,比如令牌程序文件和vocab.txt .
config.json
pytorch_model.bin
special_tokens_map.json
tokenizer_config.json
vocab.txt
发布于 2022-09-07 02:45:44
这些不同的文件是模型的元数据和正在使用的令牌程序(当您序列化模型时,这是输出)。要从HF集线器微调一个预先训练过的模型,您可以使用PyTorch或TF,也可以使用训练员类,在那里您不必编写自己的自定义培训代码。例如:
trainer = Trainer(
model=model,
args=training_args,
train_dataset=small_train_dataset,
eval_dataset=small_eval_dataset,
compute_metrics=compute_metrics,
)
参考这里的官方文档,了解如何对经过预先培训的模型进行端到端的调优:https://huggingface.co/docs/transformers/training。
https://stackoverflow.com/questions/73595680
复制相似问题