使用pytorch进行BERT文本分类

文章/答案/技术大牛

发布

1回答

规范客户反馈文本/word-云/word-计数摘要

nlp

我正试图对人们从电子邮件中反馈的兴趣进行第一次分析。作为第一次分析，我做了一个简单的字数，以了解关键字。

浏览 0提问于2022-08-24得票数 1

回答已采纳

1回答

python、nlp、pytorch、classification、bert-language-model

我正在尝试在这个代码 [https://towardsdatascience.com/bert-text-classification-using-pytorch-723dfb8b6b5b]的帮助下建立一个文本分类的BERT模型。我的数据集包含两列(标签、文本)。标签可以有三个值(0,1,2)。代码工作正常，没有任何错误，但混淆矩阵的所有值都是0。我的代码有什么问题吗？test_iter = Iterator(test, batch_size=16, dev

浏览 65提问于2021-09-20得票数 0

回答已采纳

1回答

我想用BERT的隐藏状态用分类算法进行分析

python、pytorch、huggingface-transformers

我使用的是包，伯特和PyTorch。我指的是这个。本文件第4.1节指出， attention_probs = nn.Softmax(dim=-1)(attention_scores) 如果我按照论文的方式看它，它是否意味着在通过Softmax函数之

浏览 3提问于2021-11-10得票数 0

回答已采纳

1回答

如何在BertForSequenceClassification之上添加额外的致密层？

text-classification、bert-language-model、pytorch-lightning

我想在分类层(我使用的是PyTorch lightning)之前添加一个额外的层(和dropout)，最好的方法是什么？

浏览 62提问于2021-05-05得票数 0

回答已采纳

1回答

NameError:未定义名称“TokenizeProcessor”

python、bert-language-model、fast-ai

我是第一次运行一个用于文本分类的BERT模型。fastai.text import * from pytorch_pretrained_bert.modelingimport BertConfig, BertForSequenceClassification from pytorch_pretrained_bert

浏览 5提问于2021-05-18得票数 0

1回答

重新训练BERT模型

nlp、pytorch、text-classification、bert-language-model、pre-trained-model

我已经使用pytorch为分类任务训练了大约一百万个文本数据的BERT模型。在用新数据测试这个模型后，我得到了假阳性和假阴性。现在我只想用FN和FP重新训练现有的模型。如何仅使用这些FN和Fp重新训练此bert模型，而不是先前训练的模型。

浏览 31提问于2021-11-23得票数 0

1回答

如何加载部分预训练的pytorch模型？

python、machine-learning、pytorch、pre-trained-model、spacy-transformers

我正在尝试让pytorch模型运行在句子分类任务上。不幸的是，ClinicalBert模型只将文本分类为1个二进制标签，而我有281个二进制标签。，其中bert之后的最终分类器长度为281。如何从ClinicalBert模型加载预训练的Bert权重，而不加载分类权重？我目前尝试替换pytorch_pretrained_bert包中的from_pretrained函数，并像这样弹出分类器权重和偏差：

浏览 94提问于2020-04-14得票数 6

1回答

基于神经网络的极短序列和超长序列处理

nlp、lstm、multiclass-classification、embeddings、sequence

为了训练模型，我对序列进行了后填充，使所有序列具有相同的长度。生成的数据集具有此形状(1500,1000)。我曾经尝试过EMBEDDING+LSTM ( first mask_zero=True)对序列进行映射和分类，但即使模型达到了很高的精度，也可以根据序列的长度对模型进行随机/假数据的评估:表明该模型是对长度而不是值进行学习主要的问题是，即使我们在嵌入层中使用"mask_zero“，该模型在0上也会有更多的学习。我的问题是：有人能建议一种方法来处理很长的序列吗？

浏览 0提问于2021-07-26得票数 1

2回答

使变压器BertForSequenceClassification初始层不可训练以进行pytorch训练

pytorch、huggingface-transformers

我正在尝试与BertForSequenceClassification 一起进行迁移学习 self.bert = BertForSequenceClassification.from_pretrained('bert-base-uncased', num_labels= 17) return self.bert(x) 一旦我打印

浏览 5提问于2020-04-23得票数 0

4回答

对于文本分类任务，您会使用哪种模型(GPT2、BERT、XLNet等)？为什么？

tensorflow、nlp、language-model、bert-language-model

我正在尝试为句子分类任务训练一个模型。输入是一个句子(整数的向量)，输出是一个标签(0或1)。我在各处看到过一些关于使用Bert和GPT2执行文本分类任务的文章。然而，我不确定我应该从哪一个开始。在自然语言处理中的这些最新模型中，您会使用原始变压器模型、Bert、GPT2、XLNet中的哪些模型作为开始？为什么？我更愿意在Tensorflow中实现，但我也可以灵活地使用PyTorch。谢谢!

浏览 5提问于2019-09-09得票数 8

2回答

Google Colab中的BERT多类文本分类

python、pytorch、data-science、google-colaboratory、bert-language-model

experienc... 0 1 0 1我已经使用以下命令安装了pytorch-pretrained bert：我已经导入了模型，并尝试使用以下命令对‘post’列进行标记：from pytorc

浏览 2提问于2019-06-23得票数 2

2回答

使用tensorflow实现HuggingFace BERT进行句子分类

tensorflow、text-classification、huggingface-transformers、bert-language-model

我正在尝试训练一个模型来预测真实的灾难推文(Kaggle竞赛)，使用拥抱脸bert模型对推文进行分类。我遵循了许多教程，使用了许多bert模型，但没有一个可以在COlab中运行，并抛出了错误!/embeddings:0', 'tf_distil_bert_model_23/distilbert/embeddings/LayerNorm/gamma:0', 'tf_d

浏览 5提问于2020-06-14得票数 1

1回答

自定义拥抱面bert模型中的编码模块

nlp、text-classification、huggingface-transformers、bert-language-model

我正在使用进行文本分类项目。encode_plus函数为用户提供了一种生成输入ids、注意掩码、令牌类型ids等的方便方法。例如：bert_base_tokenizerpad_to_max_length=True, r

浏览 2提问于2020-06-19得票数 1

回答已采纳

1回答

伯特将提取本地特征

bert

Bert是经过预先训练的模型，可以对文本分类进行微调。如何使用BERT提取局部特征

浏览 0提问于2021-08-02得票数 0

回答已采纳

1回答

使用BERT的文本分类-如何处理拼写错误的单词

pytorch、text-classification、huggingface-transformers、bert-language-model、misspelling

我正在研究一个文本多类分类问题。我构建了一个基于BERT概念的模型，并在PyTorch (huggingface transformer library)中实现。例如，如果输入是"NALIBU DRINK“，Bert标记器会生成'na'，'##lib'，'##u'，'drink‘，模型的预测是完全错误的。另一方面，如果我纠正了第一个字符，所以我的输入是"MALIBU DRINK"，Bert

浏览 38提问于2020-04-04得票数 0

1回答

BERT标记器和模型下载

python、github、pytorch、huggingface-transformers、bert-language-model

但是，由于公司网络的安全性，以下代码不会直接接收bert模型。tokenizer = BertTokenizer.from_pretrained('bert-base-multilingual-cased', do_lower_case=False)所以我想我必须下载这些文件并手动输入位置我目前

浏览 5提问于2020-01-12得票数 6

回答已采纳

2回答

加载预先训练的BERT模型错误-错误-没有找到名为[‘py手电传递模型.BERT’，‘tf_model.h5’‘的文件

huggingface-transformers

以前，我使用huggingface库来执行。这需要一个语料库，一个现有的BERT模型，并使用这个语料库对模型进行微调。它们的版本现在是：transformers 3.0.2torchtext 0.5.0 bert_model = transformers.TFBert

浏览 9提问于2020-12-01得票数 2

1回答

如何对bert微调模型进行再次微调

nlp、bert-language-model

我使用ktrain对文本分类的bert模型进行了微调。同样，我想在另一个文本分类数据上对此模型进行微调。我该怎么做？

浏览 23提问于2021-04-29得票数 1

1回答

句子多类分类的BertForSequenceClassification与BertForMultipleChoice

python、machine-learning、pytorch、bert-language-model、huggingface-transformers

我正在研究一个文本分类问题(例如情感分析)，在这个问题上，我需要将文本字符串分类为五个类中的一个。我应该用哪一个来完成我的5路分类任务？它们的适当用例是什么？我不确定这类是否只适用于2类分类(即logistic

浏览 5提问于2020-03-10得票数 17

回答已采纳

3回答

在使用Spacy，Bert时，是否有必要对文本分类进行停用词删除、词干提取/词汇化？

nlp、spacy、text-classification、bert-language-model

当使用Spacy，Bert或其他高级NLP模型来获得文本的向量嵌入时，文本分类是否有必要进行停用词删除、词干提取和词汇化？Text=“婚礼上供应的食物非常美味” 1.由于Spacy，Bert是在巨大的原始数据集上训练的，在使用bert/spacy生成用于文本分类任务的嵌入之前，在这些文本上应用停用词删除、词干提取和词汇化是否有任何好处2.我可以理解，当我们使用</

浏览 4提问于2020-08-28得票数 7

点击加载更多

规范客户反馈文本/word-云/word-计数摘要