如何在训练后查看huggingface模型的变化？_如何在完成训练过程后获得模型的训练精度？_如何在训练后获得模型的最高精度 - 腾讯云开发者社区

、、、、

我正在尝试使用Tensorflow对Huggingface中预先训练好的BERT模型进行微调。一切都很顺利，模型的构建和训练都没有错误。但当我尝试保存模型时，它停止并显示错误"IndexError: list index out of range“。我正在使用谷歌Colab和TPU。任何帮助都将不胜感激！代码： import tensorflow as tf from tensorflow.keras import activations, optimizers, losses from transformers import TFBertModel def create_mod

浏览 22提问于2021-03-10得票数 3

1回答

保存一个具有自定义前向函数的Bert模型并在Hugginface面上运行

、、、、

我已经创建了自己的BertClassifier模型，从预先训练开始，然后添加由不同层组成的自己的分类头。微调之后，我想使用model.save_pretrained()保存模型，但当我打印它时，从预先训练过的上传它，我没有看到我的分类器头。代码如下。如何将所有的结构保存在我的模型中，并使其完全可以使用AutoModel.from_preatrained('folder_path')访问？谢谢! class BertClassifier(PreTrainedModel): """Bert Model for Classification Tasks

浏览 33提问于2022-06-04得票数 0

回答已采纳

1回答

使用HuggingFace库在Pytorch中训练n%的最后一层BERT (训练12个中的最后5个BERTLAYER )

、、、、

Bert有一个类似于encoder -> 12 BertLayer -> Pooling的架构。我想训练Bert模型的最后40%层。我可以冻结所有图层，如下所示： # freeze parameters bert = AutoModel.from_pretrained('bert-base-uncased') for param in bert.parameters(): param.requires_grad = False 但我想训练最后40%的层。当我做len(list(bert.parameters()))时，它会给我199。所以让我们假设79是4

浏览 58提问于2020-11-26得票数 1

1回答

BertForSequenceClassification类和我的自定义Bert分类之间的指标不匹配

、

我实现了我的自定义Bert二进制分类模型类，在Bert模型(附在下面)之上添加了一个分类器层。然而，当我使用官方的BertForSequenceClassification模型进行训练时，准确性/指标会有很大的不同，这让我想知道我是否在课堂上遗漏了什么。我有几点疑问：在加载官方的BertForSequenceClassification from_pretrained时，分类器的权重是从预训练模型中初始化的，还是随机初始化的？因为在我的自定义类中，它们是随机初始化的。 class MyCustomBertClassification(nn.Module): def __init_

浏览 98提问于2020-12-11得票数 1

回答已采纳

1回答

PyTorch - FineTuning bert -振荡损失-精度很差

、、、

我一直在尝试通过源代码来训练一个漏洞检测模型。而且，经过一点搜索，我认为一个很好的起点可能是使用来自HuggingFace和PyTorch和pl.lightning火炬的预培训变压器模型。我选择DistilBert是因为它是最快的。我有一个不平衡的数据集，大约70%的非易受攻击和30%的易受攻击功能. 然而，我的成绩一直很差。这个模型似乎没有学习和推广。具体来说，在训练期间，列车损失剧烈振荡，准确率约为70 %，召回率极低(这意味着模型总是预测一个标签)。我想知道我的代码是否存在明显的问题。这是我第一次使用预先训练过的模型和闪电，我不知道可能出了什么问题。 class Model(pl.L

浏览 6提问于2022-05-11得票数 1

1回答

keras+transformers模型上的"saved_model_cli show“显示与用于训练的模型不同的输入和形状

、、、

我正在使用transformers TFBertForSequenceClassification.from_pretrained和‘bert-base-multilingual uncased’)和keras来构建我的模型。 loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True) # metric metric = tf.keras.metrics.SparseCategoricalAccuracy('accuracy') # optimizer optimizer = tf.kera

浏览 26提问于2020-08-31得票数 1

1回答

传递权更新中多任务学习模型的交替训练

、、、

我希望在两个相关数据集上建立一个多任务学习模型，该模型具有不同的输入和目标。这两个任务共享低级层，但具有不同的头层，这是一个最小的例子： class MultiMLP(nn.Module): """ A simple dense network for MTL on hard parameter sharing. """ def __init__(self): super().__init__() self.hidden = nn.Linear(100, 200) s

浏览 1提问于2020-09-06得票数 2

回答已采纳

1回答

如何使用预先训练过的模型进行文本分类？精调模型与预训练模型的比较

、、

我想知道微调后的模型与不经过精细调整的模型相比有多大的改善，我想比较一下预先训练的模型( BERT)和通过对文本分类的预训练模型进行微调所获得的模型(微调BERT )的性能，我知道如何微调BERT来进行文本分类，但不太清楚如何直接使用BERT来实现classification.what呢?下面是微调模型的代码，如何重写它以直接使用经过培训的模型。  from transformers import BertTokenizer, BertModel import torch import torch.nn as nn im

浏览 12提问于2022-08-05得票数 0

1回答

在使用bert模型作为嵌入向量时，我需要在自己的数据上进行训练吗？

、、

当我尝试huggingface模型时，它给出了以下错误信息： from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased") model = AutoModel.from_pretrained("bert-base-uncased") inputs = tokenizer("Hello world!", return_tensors="pt") outputs = mod

浏览 1提问于2021-05-19得票数 0

3回答

如何计算带有注意掩码的HuggingFace变压器BERT令牌嵌入的均值/最大值？

、、、

我使用的是HuggingFace Transformers BERT模型，我想要计算一个摘要向量(a.k.a )。在句子中的标记上嵌入)，使用mean或max函数。复杂的是，有些标记是[PAD]，所以在计算平均值或最大值时，我想忽略这些标记的向量。下面是一个例子。我最初实例化了一个BertTokenizer和一个BertModel import torch import transformers from transformers import AutoTokenizer, AutoModel transformer_name = 'bert-base-uncased'

浏览 0提问于2020-12-01得票数 7

回答已采纳

1回答

ValueError:不推荐使用与输入大小(torch.Size([16，1]))不同的目标大小(torch.Size([2，1]))

、

我正在尝试为Quora问题对数据集构建一个模型，其中输出是二进制的1或0，但我得到了这个错误。我知道我的模型的输出形状与输入形状不同，但我不知道如何修复它。批处理大小设置为16 class Bert_model (nn.Module): def __init__(self) : super(Bert_model,self).__init__() self.bert = BertModel.from_pretrained('bert-base-uncased', return_dict=False) self

浏览 307提问于2021-11-21得票数 0

1回答

如何使用Huggingface BERT模型来输入CNN的二进制分类器？

、、

我对如何使用huggingface transformers输出来训练一个简单的语言二进制分类器模型感到有点困惑，该模型可以预测阿尔伯特·爱因斯坦是否说过一句话。 from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased") model = AutoModel.from_pretrained("bert-base-uncased") inputs = ["Hello World",

浏览 29提问于2021-08-26得票数 1

1回答

基于训练好的BERT模型、拥抱人脸的文本情感预测

、、、

我用正面、负面和中性的类别来预测推文的情绪分析。我用拥抱脸训练了一个BERT模型。现在，我想要对未标记的Twitter文本的数据帧进行预测，但我遇到了困难。我遵循了以下教程(https://curiousily.com/posts/sentiment-analysis-with-bert-and-hugging-face-using-pytorch-and-python/)，并能够使用Hugging训练BERT模型。这是一个对原始文本进行预测的示例，但它只有一句话，我想使用一列Tweets。https://curiousily.com/posts/sentiment-analysis-w

浏览 68提问于2021-11-03得票数 0

回答已采纳

1回答

使用带keras的预先训练好的转换器

、、

我想使用这个预先训练好的模型：Hate-speech-CNERG/dehatebert-mono-arabic 我使用以下代码来使用Keras (我通常使用的库)构建模型： def build_model(transformer, max_len=512): """ function for training the model """ input_word_ids = Input(shape=(max_len,), dtype=tf.int32, name="input_word_ids")

浏览 69提问于2021-04-13得票数 0

2回答

“使用bos_token，但尚未设置”的含义是什么。

、、、

当我运行demo.py时 from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("distilbert-base-multilingual-cased") model = AutoModel.from_pretrained("distilbert-base-multilingual-cased", return_dict=True) # print(model) def count_parameters(model):

浏览 17提问于2020-12-21得票数 6

1回答

如何在tensorflow中使用transformers保存每个时期的最佳模型

、、、

我使用了TFBertModel和Tensorflow模型来结合和训练拥抱的面部变形。我想保存每个时代的val_accuracy的最佳模型。我使用'tensorflow检查点‘，但我得到了error.How我是否可以保存每个时代的最佳模型与transformers在tensorflow？ from tensorflow.keras.callbacks import EarlyStopping from tensorflow.keras.initializers import TruncatedNormal from tensorflow.keras.losses import Cate

浏览 187提问于2021-06-19得票数 0

2回答

RuntimeError: CUDA错误:设备端断言触发- BART模型

、、

我正在尝试为一个文本生成任务运行BART语言模型。当我使用另一个编码器-解码器模型(T5)时，我的代码工作得很好，但在使用bart时，我得到了这个错误： File "train_bart.py", line 89, in train outputs = model(input_ids = ids, attention_mask = mask, decoder_input_ids=y_ids, labels=lm_labels) cs-lab-host1"

浏览 258提问于2021-08-10得票数 1

回答已采纳

2回答

减少BERT的推理时间

、、

我想进一步改进BERT的推理时间。代码如下： for sentence in list(data_dict.values()): tokens = {'input_ids': [], 'attention_mask': []} new_tokens = tokenizer.encode_plus(sentence, max_length=512, truncation=True, padding='max_length',

浏览 6提问于2021-09-15得票数 2

2回答

无论字符串大小如何，BERT输出都可以固定在形状上吗？

、、、

我对使用huggingface模型以及如何使它们在固定形状下产生预测而感到困惑，而不管输入大小(即输入字符串长度)。我试图用参数padding=True, truncation=True, max_length = 15调用令牌程序，但是inputs = ["a", "a"*20, "a"*100, "abcede"*20000]的预测输出维数并不固定。我在这里错过了什么？ from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.f

浏览 10提问于2021-09-03得票数 1

回答已采纳

1回答

拥抱式变压器将logit分数转换成概率

、、、、

我是这个领域的初学者，我被困住了。我遵循本教程()构建一个多标签分类使用拥抱脸转换器。下面是我用来训练我的模型的代码。 # Name of the BERT model to use model_name = 'bert-base-uncased' # Max length of tokens max_length = 100 PATH = 'uncased_L-12_H-768_A-12/' # Load transformers config and set output_hidden_states to False config = BertConf

浏览 0提问于2021-01-27得票数 1