使用HuggingFace对预训练任务进行mBART微调_使用预卷积特征对Resnet进行微调_当使用Huggingface TFTrainer类对模型进行微调时，如何指定损失函数？ - 腾讯云开发者社区

python、nlp、huggingface-transformers、pre-trained-model、fine-tune

我想使用预训练任务对我的数据进行facebook/mbart-large-cc25调优，特别是掩蔽语言建模(MLM)。我如何在HuggingFace中做到这一点？编辑:为了清晰起见，重写了问题

浏览 147提问于2021-09-23得票数 1

1回答

如何理解mbart中的decoder_start_token_id和forced_bos_token_id？

pytorch、multilingual、huggingface-transformers

当我想使用huggingface的预训练模型进行多语言实验时，参数decoder_start_token_id和forced_bos_token_id的含义让我感到困惑。= MBart50TokenizerFast.from_pretrained("facebook/mbart-large-50-many-to-many-mmt") # translate HindiUseful for multilingual models like :doc:`<em

浏览 1提问于2021-07-09得票数 0

1回答

什么是更好的自定义培训的bert模型或使用该模型与预先培训的数据？

python、nlp、huggingface-transformers、nlp-question-answering

我对自己的模型进行了一段时间的编码，但我看到了拥抱的面孔，并开始使用它。我想知道我是应该在自己的数据集中使用预培训模型还是训练模型(相同的拥抱脸模型)。我在试着做一个问答模型。

浏览 8提问于2022-08-12得票数 2

回答已采纳

1回答

如何更改transformers.bert的最大序列长度？

pytorch、transform、bert-language-model

我下载了基于bert的预训练模型。我编辑config.json (从512到256) "max_position_embeddings": 256, 然后我想使用bert模型， from transformers import BertForSequenceClassification

浏览 260提问于2020-10-23得票数 0

1回答

微调Blenderbot

tensorflow、nlp、pytorch、huggingface-transformers、blenderbot

我一直在尝试微调HuggingFace的会话模型:混合体。我尝试了官方拥抱脸网站上给出的传统方法，它要求我们使用trainer.train()方法。我还使用.compile()方法进行了尝试。我尝试过使用PyTorch和TensorFlow对我的数据集进行微调。这两种方法似乎都失败了，并给出了一个错误，说明没有名为Blenderbot模型的编译或训练方法。我还在网上到处查看Blenderbot是如何对我的自定义数据<

浏览 19提问于2022-06-27得票数 3

4回答

如何在未标记的数据上微调BERT？

nlp、pytorch、huggingface-transformers、bert-language-model

我想在特定的域上对BERT进行微调。我在文本文件中有该域的文本。我如何使用这些来微调BERT？我目前正在寻找。我的主要目标是使用BERT实现句子嵌入。

浏览 3提问于2020-05-23得票数 6

1回答

从pytorch到tensorflow的飞马

tensorflow、pytorch、huggingface-transformers

我使用对飞马模型进行了微调，它使用huggingface进行抽象摘要。输出模型在pytorch中。有没有办法把它转换成tensorflow模型，这样我就可以在javascript后端使用它了？

浏览 4提问于2021-07-06得票数 0

2回答

使用MLM对语言模型进行持续的预训练与微调

deep-learning、nlp、huggingface-transformers、bert-language-model、pre-trained-model

我有一些定制的数据，我想使用进一步培训的伯特模型。到目前为止，我已经尝试了以下两种方法： BertForPreTraining model)Starting 从一个预先培训的BERT检查点开始，并继续使用蒙面语言建模(MLM) +下一句预测(NSP)头进行预培训但我仍然感到困惑的是，如果使用BertForPreTraining或BertForMaskedLM真的对伯特进行持续的预培训，或者这只是两个微调模型，分别使用

浏览 5提问于2021-07-20得票数 5

回答已采纳

1回答

确定语篇输入的语法有效性

nlp、nltk、stanford-nlp

(这只是我从使用斯坦福NLP的GUI工具中获得的短暂收获)。我的问题如下：是否有一些工具可以扫描文本输入，并确定它是否由有效的英语单词组成，或者至少提供了一个可能性？

浏览 3提问于2021-01-22得票数 0

1回答

HUGINGFACE类型错误：“NoneType”和“int”实例之间class>不支持

deep-learning、data-science、huggingface-transformers、huggingface-tokenizers、huggingface-datasets

我正在进行自定义数据集(使用HuggingFace)数据集的微调预培训模型，我将正确地从一个YouTube视频中复制所有代码，但是在这个单元格/代码中，一切正常： with training_args.strategy.scope

浏览 51提问于2021-08-21得票数 3

回答已采纳

1回答

无/少标签文本数据的主题分类

nlp、unsupervised-learning、supervised-learning、text-classification、semi-supervised-learning

否则，我可以尝试一种方法，例如，使用所有不同的标签标记1000个输入文本，并使用有监督的方法，很少有标记的数据。这对学习过程有帮助吗？在这种情况下我能用什么方法呢？

浏览 0提问于2023-02-09得票数 1

回答已采纳

1回答

Blenderbot FineTuning

python、tensorflow、nlp、pytorch、huggingface-transformers

我一直在尝试微调HuggingFace的会话模型:混合体。我尝试了官方拥抱脸网站上给出的传统方法，它要求我们使用trainer.train()方法。我使用.compile()方法进行了尝试。我尝试过使用PyTorch和TensorFlow对我的数据集进行微调。这两种方法似乎都失败了，并给出了一个错误，说明没有名为Blenderbot模型的编译或训练方法。我甚至在网上到处查看Blenderbot是如何对我的自定义数据<

浏览 7提问于2022-06-27得票数 6

1回答

将GPTJ-6b格式的微调转换为HuggingFace格式的内存使用

tpu、jax、gpt、gpt-3

在本教程之后，使用TPU对GPTJ进行微调，效果很好。为什么使用to_hf_weights.py转换为huggingface格式的步骤在256 to的内存中会出现问题--即使在应用减肥法之后也是如此？我提出的问题是：

浏览 12提问于2022-03-08得票数 1

1回答

为什么mBART50语言代码格式不寻常？

machine-translation

我正在尝试使用mBART进行多语种翻译(大约30种语言)，但我在使用它时面临一个问题，因为我目前正在使用兰吉德识别语言，然后加载mBART并根据已识别的语言代码翻译所有单词。但是mBART对语言代码使用这种奇怪的格式，例如：hi_IN -> Hindi而Langid以这种格式输出它们： af, am,an, ar, as, az, be, bg

浏览 0提问于2021-02-19得票数 0

回答已采纳

1回答

深度学习NLP：“高效”的BERT类实现？

keras、deep-learning、nlp、pytorch、multilabel-classification

我有大约200,000个需要标记的文档，我有大约2,000个注释集，用作训练/测试/微调的基础事实。我还有更多与领域相关的文档可用于预培训。我很可能需要从头开始进行预训练，因为这是在临床领域。我也对预先训练过的模型持开放态度，如果他们可能有机会进行微调，比如拥抱脸部等。人们会建议以哪些兼容PyTorch或Keras的模型及其实现作为起点？

浏览 45提问于2020-05-15得票数 1

回答已采纳

1回答

有没有办法在没有配置文件的情况下使用预先训练过的变压器模型？

python、pytorch、huggingface-transformers

我想微调一个预先训练的变压器模型的问题回答。该模型是预先培训的大型工程和科学相关的语料库。我得到了一个包含模型权重的"checkpoint.pt“文件。在初始化BertModel时不使用模型检查点的一些权重：“文件”、“优化器”、“模型”、“主参数”。这是预期的，如果您是从一个模型的检查点对另一个任务或使用另一个架构来初始化BertModel (例如从BertForPreTraining模型初始化一个BertForSequenceClassification

浏览 4提问于2021-08-12得票数 0

回答已采纳

1回答

未初始化的预训练BERT模型的权重

tensorflow、nlp、pytorch、bert-language-model、huggingface-transformers

我正在使用 (点燃)加载和分析一个伯特模型，我预先培训了一个新的任务。from pretrained model not used in BertForTokenClassification: ['bert.embeddings.position_ids'] 然后，它只使用

浏览 1提问于2021-03-10得票数 0

回答已采纳

1回答

用Keras和Python创建NER模型

python、keras、nlp

我只使用了不同的公司名称，不同的日期共振峰和不同的街道地址进行培训。因此，我的数据集中的每一行都有1到5个单词(有些单词可以是数字)。对于预处理，我使用了向量化器：我的模型接受字符串输入，并决定它是公司、个人还是

浏览 4提问于2021-03-27得票数 3

2回答

“拥抱脸”模型的预训练层被冻结了吗？

nlp、pytorch、huggingface-transformers、bert-language-model

我使用了Huggingface中的以下分类模型：所以我还需要做这样的事吗？

浏览 9提问于2022-07-04得票数 1

回答已采纳

1回答

使用OpenNMT进行迁移学习

python、pytorch、transformer、transfer-learning、opennmt

我正在使用OpenNMT-py对MIDI音乐文件训练一个转换器模型，但结果很差，因为我只能访问与我想要研究的风格相关的一个小数据集。为了帮助模型学习一些有用的东西，我想使用一个更大的其他音乐风格的数据集进行预训练，然后使用小数据集对结果进行微调。我想在预训练后冻结变压器的编码器一侧，让解码器部分自由进行微调。如何使用OpenNMT-py做到这一点？

浏览 21提问于2019-05-02得票数 0

点击加载更多