使用BERT编码器的二进制分类模型保持50%的准确率

是指该模型在对二分类问题进行预测时，仅能达到50%的准确率。BERT是一种基于Transformer模型的预训练语言模型，可以用于各种自然语言处理任务。

具体来说，BERT编码器可以将输入的文本进行编码，生成高维的向量表示，然后将这些向量输入到分类器中进行分类预测。对于二进制分类任务，通常使用一个sigmoid激活函数将输出限制在0到1之间，大于0.5的预测值被认为是正例，小于等于0.5的被认为是负例。

然而，如果使用BERT编码器的二进制分类模型仅能保持50%的准确率，这意味着模型无法对输入进行有效的学习和区分，无论输入是正例还是负例，模型的预测结果都是随机的。这种情况下，需要对模型进行进一步调优、增加数据量、调整超参数等操作，以提高模型的准确率。

对于BERT模型的改进和调优，可以考虑以下方向：

数据集：确保使用的训练数据集具有足够的多样性和数量，包含代表性的正负例样本，避免类别不平衡问题。
微调：通过在BERT模型的基础上进行微调，针对特定任务进行训练。微调过程中可以调整学习率、优化器、批次大小等超参数，以提高模型性能。
文本预处理：对输入文本进行适当的清理和预处理，如分词、去除停用词、词干化等，以减少噪声对模型的影响。
模型结构：尝试使用不同的模型结构或架构进行实验，例如使用不同的Transformer层数、隐藏单元数等。
数据增强：通过在训练数据中引入噪声、合成新样本等方式，增加数据的多样性，提高模型的泛化能力。
超参数调优：通过网格搜索、随机搜索等方法，寻找最优的超参数组合，以提高模型性能。
集成学习：尝试使用集成学习的方法，如投票、平均等，结合多个模型的预测结果，以提高整体性能。

在腾讯云中，可以使用腾讯云机器学习平台（https://cloud.tencent.com/product/tiia）进行BERT模型的训练和部署。腾讯云提供了一系列的机器学习相关服务和产品，以帮助用户进行模型开发和应用部署。

使用BERT编码器的二进制分类模型保持50%的准确率

、、

我正在尝试为Yelp二进制分类任务训练一个简单的模型。Load BERT编码器： gs_folder_bert = "gs://cloud-tpu-checkpoints/bert/keras_bert/uncased_L-12_H-768_A-12" bert_config_fileBERT嵌入数据： encoder_outpu

浏览 40提问于2020-09-27得票数 1

1回答

如何微调BERT基础(无基础模型)以生成嵌入？

、、、、

在互联网上，我找到的只是分类tasks.But的例子，在我的问题中没有标签。(我只有一组tweet)。我的任务如下:使用BERT生成单词嵌入，现在在下一个任务中使用这个单词嵌入。我的目标:我想对BERT进行微调，以产生更好的单词嵌入。如何做到这一点？

浏览 15提问于2021-11-12得票数 0

3回答

在神经网络中，二进制文本分类的最佳激活函数是什么？

、、、、

我知道有很多激活函数，比如Relu，sigmoid，tanh ..etc，我只想知道最好的例子-二进制文本分类。但这些预测并没有达到预期的水平。我也把稠密的单位改为1024，保持其他单位不变，但我仍然有错误的预测。(验证准确率为50</em

浏览 0提问于2019-08-02得票数 2

1回答

如何处理自然语言处理中的类不平衡问题？

、、、

我正在做一个NLP二进制分类任务，在上面使用Bert + softmax层。网络使用交叉熵损失。当正类与负类的比例为1:1或1:2时，该模型对两类进行了正确的分类(每类的准确率约为0.92)。当比例为1:3 : 1:10时，模型表现不佳。当比例为1:10时，该模型对负类实例的正确分类精度为0.98，而对正类实例的</e

浏览 0提问于2021-03-27得票数 1

回答已采纳

1回答

我正在尝试使用序列到序列模型进行命名实体识别.我的输出是简单的IOB标记，因此我只想预测每个令牌(IOB)的3个标签的概率。我正在尝试使用HuggingFace实现EncoderDecoderModel --使用DistilBert作为编码器，以BertForTokenClassification作为解码器。首先，我导入我的编码器和解码器： encoder = AutoModelForSequenc

浏览 2提问于2021-10-25得票数 1

回答已采纳

1回答

从bert创建单词嵌入，并将它们输入随机林进行分类

、、、、

我已经使用伯特基地预先训练的512个维度的模型来生成上下文特征。将这些向量提供给随机森林分类器可以提供83 %的准确率，但在各种研究中，我已经看到伯特最小值提供了90 %的准确率。即使我合并了所有的功能，我也得到了83 %的准确率。我作为基础论文的研究论文提到了92 %的准确率，但是他们使用了一种基于集合的方法

浏览 21提问于2022-04-01得票数 0

2回答

需要帮助选择损失函数

、、、、

我已经使用resnet50解决了一个多类分类问题。该模型输出每个类的概率。我应该为我的模型选择哪个损失函数？选择二进制交叉熵后： ? 选择分类交叉熵后： ? 上面的结果是对于相同的模型，只是损失不同，functions.This模型应该将图像分为26类，因此分类交叉熵应该起作用。另外，在第一种情况下，准确率约为96%，但损失很高。为什么？

浏览 33提问于2019-05-05得票数 0

回答已采纳

1回答

使用keras函数api从头开始训练VGG16。所有测试图像都被预测为一个类

、、、

我正在使用functional训练基于VGG16架构的CNN。数据集有2个类(汽车和飞机)，每个类有500个用于训练的图像和100个用于验证的图像。我没有得到好的结果。此外，在预测时，它将所有图像归为一类(如果我给汽车图像，它将o/p作为飞机)，请帮助我获得正确的输出。帮我纠正我的观念import numpy as npimport math from keras.preprocessing

浏览 0提问于2021-09-12得票数 0

2回答

训练损失在12个时期后增加

、、

我有一个模型，在7-14个时期后，它几乎以100%的准确率学习分类(二进制分类)，但在达到0.0004的最小损失后，在下一个时期，它会跃升到7.5%(这意味着它有50%的机会正确分类，同样有纯粹的机会)，然后在所有后续时期保持在7附近。我使用adam optimiser，它可以解决学习率问题。这种巨大的跳跃不会发生在SG

浏览 1提问于2018-04-03得票数 2

1回答

如何加载部分预训练的pytorch模型？

、、、、

我正在尝试让pytorch模型运行在句子分类任务上。在处理医学笔记时，我使用的是ClinicalBert (https://github.com/kexinhuang12345/clinicalBERT)，并希望使用其预先训练好的权重。不幸的是，ClinicalBert模型只将文本分类为1个二进制标签，而我有281个二进制标签。，其中bert

浏览 94提问于2020-04-14得票数 6

1回答

使用Softmax进行二进制分类

、、、、

我正在使用Sigmoid激活函数和二进制交叉点训练一个二进制分类器，它的准确率在98%左右。当我使用softmax和categorical_crossentropy进行训练时也是如此，准确率非常低(< 40%)。我将binary_crossentropy的目标作为0和1的列表传递，例如: 0,1,1,1,0。这是我用于第二个分类器的模型

浏览 3提问于2017-08-21得票数 16

回答已采纳

1回答

在多标签分类的基础上使用多类分类是一种不良做法吗？

、、、

我有一个多标签的分类问题--数以百万计的记录可能包含多个标签。我在网上遇到了与缺乏研究/例子有关的问题，并且无法创建一个强有力的模型。是否建议不要建立多类分类模型，并将任何预测概率超过0的标签视为潜在的标签？即使使用问题转换，如二进制相关性和分类器链，准确率也非常低(~12%)，而不是使用朴素贝叶斯和获得57%

浏览 0提问于2018-06-04得票数 1

1回答

使用BERT模型检索“相关令牌”(已经过微调)

、、、

我已经针对分类任务对BERT模型(使用huggingface库)进行了微调，以预测两种类型的帖子类别(例如，1和0 )。但是，我需要检索被预测为类别1的文档的“相关令牌”(例如)。我知道，一旦我用BERT模型将所有帖子标记为1(例如)，我就可以使用传统的TF-IDF方法。但我有以下问题:有没有可能用经过微调的BERT模型的架构来

浏览 19提问于2021-03-30得票数 0

1回答

我需要微调最后的卷积层，在一个最先进的CNN模型，如ResNet50？

、、、、

我的毕业设计是使用CNN模型上的转移学习，它可以从胸部X光图像中诊断新冠肺炎。利用贝叶斯优化器利用Keras调谐器库对完全连通层数、层中节点数、学习速率、下降率等超参数进行微调，得到了很好的结果，多类分类的测试准确率为98%，二进制分类的测试准确率为99%。然而，我冻结了所有的层在原来的基础模型。我只微调了最后一个完全连接的层后

浏览 3提问于2021-02-10得票数 0

回答已采纳

1回答

BertModel或BertForPreTraining

、、、、

我只想使用Bert嵌入和使用Bert输出作为一个分类网的输入，我将从零开始构建。我认为相关的类是BertModel或BertForPreTraining。头包含两个“动作”：self.predictions是MLM (蒙面语言建模)，它赋予了BERT修正语法错误的能力，self.seq_relationship是NSP (下一句预测)，通常被称为分类头。Bert

浏览 8提问于2021-03-12得票数 4

回答已采纳

1回答

利用深度学习预测文本索引

、、

我想预测文本的开始和结束指数，其中使用了某种类型的宣传技术，如涂片、名字调用、加载语言等。数据集中的一些例子如下：因此，0和41意味着第一个例子<em

浏览 0提问于2022-02-16得票数 1

1回答

Keras DNN预测模型的精度没有提高

、、、、

我正在尝试使用<code>C0</code>数据训练Keras DNN模型进行预测。我已经对数据进行了标准化，并将其分为训练、测试和验证部分。我遇到了一个关于我的晒黑和验证准确性的问题，它(几乎)保持不变。精度始终停留在(0.1431)。我尝试了许多不同的超参数，包括将激活函数更改为tanh和relu，并尝试在第一个密集层之后添加批处理归一化层，我使用了SGD优化器(更改了学习率、动量，甚至尝试将优化器更改为Adam)，尝试了不同<em

浏览 8提问于2020-07-31得票数 0

1回答

Spacy中的顺序/上下文感知文档/句子向量

、、、、

我想用句子做一些有监督的二进制分类任务，并且一直在使用spaCy，因为它易于使用。我使用spaCy将文本转换为向量，然后将向量提供给机器学习模型(例如XGBoost)来执行分类。在spaCy中，很容易加载 (例如BERT / Roberta / XLNet)来将单词/句子转换为nlp对象。然而，直接调用对象的向量将到令牌向量的平均值。这里有两个问题： 1)我们能做得比简

浏览 17提问于2020-05-06得票数 0

1回答

Keras NLP验证损失随着训练精度的提高而增加

、、、、

我看过其他有类似问题的帖子，我的模型似乎过拟合了。然而，我尝试了正则化，dropout，减少参数，降低学习率和改变损失函数，但似乎没有什么帮助。这是我的模型：Embedding(max_words, 64),Bidirectional(GRU(64, return_sequencesx_train,y_train, batch_size=32, epochs=25, verbose=1, validation_data=(x_test

浏览 0提问于2020-05-07得票数 0

1回答

如何将bert的嵌入向量与其他特征结合起来？

、、、

我正在使用3个标签(0,1,2 = neg，pos，neu)进行分类任务。数据是句子。因此，为了生成句子的向量/嵌入，我使用一个Bert编码器来获取每个句子的嵌入，然后使用一个简单的knn进行预测。我的数据是这样的:每个句子都有一个标签和其他分类的数值。例如，我的数据如下所示 Sentence embeddings_BERT</

浏览 1提问于2021-08-17得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用BERT编码器的二进制分类模型保持50%的准确率

相关·内容

使用BERT编码器的二进制分类模型保持50%的准确率

如何微调BERT基础(无基础模型)以生成嵌入？

在神经网络中，二进制文本分类的最佳激活函数是什么？

如何处理自然语言处理中的类不平衡问题？

EncoderDecoderModel转换解码器的分类器层

从bert创建单词嵌入，并将它们输入随机林进行分类

需要帮助选择损失函数

使用keras函数api从头开始训练VGG16。所有测试图像都被预测为一个类

训练损失在12个时期后增加

如何加载部分预训练的pytorch模型？

使用Softmax进行二进制分类

在多标签分类的基础上使用多类分类是一种不良做法吗？

使用BERT模型检索“相关令牌”(已经过微调)

我需要微调最后的卷积层，在一个最先进的CNN模型，如ResNet50？

BertModel或BertForPreTraining

利用深度学习预测文本索引

Keras DNN预测模型的精度没有提高

Spacy中的顺序/上下文感知文档/句子向量

Keras NLP验证损失随着训练精度的提高而增加

如何将bert的嵌入向量与其他特征结合起来？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐