huggingface -在本地保存微调的模型-以及tokenizer？_通过在单独的docker容器中运行的R实例在本地保存R模型？_在本地与Nimblebox上保存模型的3D CNN解算结果 - 腾讯云开发者社区

bert-language-model、huggingface-transformers

我只是想知道，如果微调BERT模型并保存它，标记器是否会受到某种影响或发生变化。以后使用保存的BERT模型时，我是否也需要在本地保存记号赋予器以重新加载它？我就是这么做的 bert_model.save_pretrained('.或者我可以用正常的方式来使用它，比如： tokenizer = BertTokenizer.from_pretrained('bert-base-cas

浏览 358提问于2020-10-20得票数 1

回答已采纳

2回答

在本地下载预先训练好的句子转换器模型

word-embedding、bert-language-model、huggingface-tokenizers、sentence-transformers

我正在使用SentenceTransformers库(这里：)来使用预训练模型bert-base-nli-mean tokens创建句子的嵌入。我有一个应用程序将部署到不能访问互联网的设备上。这里，已经回答了如何保存模型。然而，我被困在从本地保存的路径加载保存的模型。当我尝试使用上面提到的技术保存模型时，输出文件如下： ('/

浏览 197提问于2020-12-23得票数 5

1回答

Huggingface Transformer - GPT2从保存的检查点恢复训练

python、pytorch、huggingface-transformers、language-model、gpt-2

恢复从run_clm.py实现的GPT2微调 GPT2 huggingface是否具有从保存的检查点恢复训练的参数，而不是从头开始再次训练？假设python笔记本在训练时崩溃，检查点将被保存，但当我再次训练模型时，它仍然从头开始训练。来源：here 微调代码： !model_name_or_path=gpt2 \ --num_train_epochs=1 \

浏览 98提问于2021-01-01得票数 1

回答已采纳

1回答

如何利用Pytorch训练器API训练带有全词掩蔽的LM模型

python-3.x、nlp、pytorch、huggingface-transformers、mlmodel

我正在从零开始通过训练语言模型来考虑微调模型。我有几个与此有关的基本问题：text=['I am huggingface fan', 'I love huggingface', ....] data_collator = DataCollatorForLanguageModeling(tokenizer=t

浏览 14提问于2022-07-08得票数 0

1回答

如何从预先训练的模型加载保存的记号赋予器

machine-learning、pytorch、huggingface-transformers

我使用huggingface transformer在Pytorch中微调了一个预先训练好的BERT模型。所有的训练/验证都在云中的GPU上完成。在训练结束时，我保存了模型和标记器，如下所示： best_model.save_pretrained('./saved_model/') tokenizer.save_pretrained('./save

浏览 19提问于2019-10-16得票数 8

回答已采纳

1回答

基于结构化数据的答疑系统实现模型

machine-learning、nlp、bert、transformer、question-answering

我需要编写一个程序(像聊天机器人)，它根据问题用户的提问从CSV数据文件中检索答案。因此，例如，如果CSV将产品列表及其规范存储在5-10列中，那么如果用户询问产品X的规范Y的问题，程序应该根据CSV返回正确的答案。我需要使用NLP，因为用户可以编写特定单词的同义词，或者提出与dataset中的关键字略有不同的问题。我认为我应该使用使用HuggingFace转换器的BERT模型，但我不知道如何使用N

浏览 0提问于2022-06-19得票数 1

1回答

在拥抱面上加载标记器: AttributeError：'AlbertTokenizer‘对象没有属性'vocab’

huggingface-transformers、huggingface-tokenizers

我正在尝试加载一个huggingface模型和令牌程序。, RobertaForMaskedLM, AlbertForMaskedLM, ElectraForMaskedLM但是由于某种原因，当我试图加载这个错误时，我会发现一个错误： tokenizer我发现了相关的

浏览 14提问于2022-08-23得票数 0

1回答

SageMaker端点无法加载拥抱面标记器

python、amazon-web-services、amazon-sagemaker、huggingface-transformers、huggingface-tokenizers

我使用亚马逊SageMaker来训练HuggingFace模型。在提供给估计器的培训脚本的末尾，我将模型保存到正确的路径(SM_MODEL_DIR)中： parser = argparse.ArgumentParsertrainer.model.save_pretrained(args.model_dir) 在对模型进行了训练之后，我使用Hugg

浏览 3提问于2021-10-01得票数 1

3回答

Huggingface保存令牌程序

huggingface-transformers、huggingface-tokenizers

我试图将令牌程序保存在拥抱面中，以便以后可以从不需要访问internet的容器中加载它。/models/tokenizer3/' is a correct model identifier listed on 'https://huggingface.co/models' - or './models/tokenizer3/' is the correct path

浏览 33提问于2020-10-27得票数 21

回答已采纳

1回答

使用HuggingFace对预训练任务进行mBART微调

python、nlp、huggingface-transformers、pre-trained-model、fine-tune

我想使用预训练任务对我的数据进行facebook/mbart-large-cc25调优，特别是掩蔽语言建模(MLM)。我如何在HuggingFace中做到这一点？编辑:为了清晰起见，重写了问题

浏览 147提问于2021-09-23得票数 1

1回答

Blenderbot FineTuning

python、tensorflow、nlp、pytorch、huggingface-transformers

我一直在尝试微调HuggingFace的会话模型:混合体。我尝试了官方拥抱脸网站上给出的传统方法，它要求我们使用trainer.train()方法。我使用.compile()方法进行了尝试。我尝试过使用PyTorch和TensorFlow对我的数据集进行微调。这两种方法似乎都失败了，并给出了一个错误，说明没有名为Blenderbot模型的编译或训练方法。我甚至在网上到处查看Blenderbot是如何对我的</

浏览 7提问于2022-06-27得票数 6

1回答

将保存的NER重新加载到HuggingFace管道？

nlp、named-entity-recognition、huggingface-transformers、huggingface-tokenizers

我正在研究HuggingFace的迁移学习功能(特别是命名实体识别)。首先，我对变压器架构有点陌生。print(nlp(sequence)) 我想要做的是在本地保存和运行这个模型，而不必每次下载"ner“模型(其大小超过1GB)。在他们的文档中，我看到可以使用"pipeline.save_pretrained()“函数将管道保存到本地文件夹。结果是各种文件，我要存储在</

浏览 0提问于2020-09-28得票数 3

回答已采纳

1回答

连(记号器)和tokenizer.vocab_size的区别是什么？

nlp、tokenize、huggingface-transformers、huggingface-tokenizers

我试图在预先训练过的HuggingFace变形金刚模型的词汇表中添加几个新单词。我做了以下工作，以更改令牌程序的词汇表，并增加模型的嵌入大小：model.resize_token_embeddings(len(tokenizer<

浏览 9提问于2021-05-06得票数 4

回答已采纳

1回答

产品描述中的文本分类问题

python、machine-learning、text-classification

我刚开始机器学习，我有一个包含4000到5000项的数据集，它们都是产品描述，结果，我想训练一个模型来将它们分类为1或0，我能用这种文本来训练它吗？

浏览 5提问于2022-10-09得票数 -1

2回答

"ValueError:您必须指定input_ids或inputs_embeds“在培训AutoModelWithLMHead模型(GPT-2)时

python、pytorch、huggingface-transformers、gpt-2

我想微调AutoModelWithLMHead模型从，这是一个德国的GPT-2模式.我遵循了教程的预处理和微调。我已经为微调准备了一堆文字段落，但在开始训练时，我会收到以下错误：ValueError: You have to specify either

浏览 7提问于2022-01-04得票数 0

回答已采纳

1回答

确定语篇输入的语法有效性

nlp、nltk、stanford-nlp

我正在寻找一些方法来确定文本输入是否采取有效句子的形式；如果没有，我想向用户提供一个警告。我想提醒用户注意的输入示例：这似乎是一个困难的问题，因为语法通常来自textbanks，而提供的句子输入中的单词可能不会出现在语法中。它似乎也似乎解析者可能假设文本输入是由有效的英语单词组成的。(这只是我从使用斯坦福NLP的GUI工具中获得的短暂收获)。我的问题如

浏览 3提问于2021-01-22得票数 0

1回答

使用Huggingface* Transformers的聊天机器人*

tensorflow、chatbot、huggingface-transformers、blenderbot

我想用Huggingface Transformers来实现一个聊天机器人。目前，我的代码如下所示。转换器模型已经考虑了过去用户输入的历史。在构建聊天机器人时，我还需要考虑其他因素(额外的代码)吗？其次，如何修改代码以使用TensorFlow而不是PyTorch运行？稍后，我还计划对其他数据的模型进行微调。我还计划测试不同的模型，比如BlenderBot和GPT2。我认为要测试这些不同的

浏览 334提问于2021-11-21得票数 1

回答已采纳

1回答

对拥抱式变压器的理解

pre-trained-model、huggingface-transformers、bert-language-model、nlp-question-answering、squad

我对Transformers概念很陌生，我正在学习一些教程，并编写自己的代码来理解Squad2.0数据集问题，使用转换器模型回答问题。在拥抱脸的网站上，我看到了两个不同的链接。我想知道这两个网站之间的区别。一个链接是否只有一个预先训练过的模型，而另一个则有一个经过预先训练和精细调整的模型？现在，如果我想使用艾伯特模型来回答问题，并使用我的Team2.0训练数据集进行培训，并评估<e

浏览 3提问于2020-05-13得票数 1

回答已采纳

3回答

有什么理由去拯救一个经过预先训练的伯特记号器吗？

save、pytorch、bert-language-model、huggingface-tokenizers

假设我使用的是tokenizer = BertTokenizer.from_pretrained('bert-base-uncased', do_lower_case=True)，在对新模型进行微调期间，我使用该令牌程序所做的全部工作就是标准的tokenizer.encode()。我在大多数地方看到，人们在保存模型的同时保存令牌，但我不清楚为什

浏览 7提问于2020-09-22得票数 2

回答已采纳

3回答

如何禁用TOKENIZERS_PARALLELISM=(true | false)警告？

pytorch、huggingface-transformers、huggingface-tokenizers

我使用pytorch训练huggingface-transformers模型，但每个时期，总是输出警告： The current process just got forked.

浏览 15提问于2020-07-02得票数 15

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云