NER无法在keras中的BERT顶部添加CRF层_在keras中的预先训练的密集层之间添加dropout层_在keras或Tensorflow中的LSTM层之前添加密集层？ - 腾讯云开发者社区

python、pytorch、huggingface-transformers

我正在学习NLP，并试图建立一个句子分类模型。我正在用模型创建类，但是我发现输入应该是张量类型，而不是元组类型是错误的。我使用4.21.2变压器版本。 class BertClassificationModel(nn.Module): def __init__(self, bert_model_name, num_labels, dropout=0.1): super(BertClassificationModel, self).__init__() self.bert = BertForSequenceClassification.from_pretr

浏览 12提问于2022-09-03得票数 1

回答已采纳

3回答

语音合成，有nodejs的SDK吗？

php、python、node.js、语音合成

腾讯云语音合成，能否提供nodejs的SDK？目前只看到有提供PHP和Python版本下载。谢谢

浏览 758提问于2018-05-28

1回答

NER无法在keras中的BERT顶部添加CRF层

python、keras、bert-language-model、named-entity-recognition、crf

在为NER训练BERT-CRF模型时，我遇到了一个未知的问题。我对CRF模型使用了keras.contrib。下面是导入的库。 !pip install transformers !pip install git+https://www.github.com/keras-team/keras-contrib.git import pandas as pd import numpy as np from transformers import TFBertModel, BertTokenizer, BertConfig import tensorflow as tf from tensorf

浏览 213提问于2021-04-14得票数 1

1回答

载入自定义NER模型斯坦福CoreNLP

java、python、python-3.x、nlp、stanford-nlp

我用斯坦福的“Stanford”软件创建了自己的NER模型，并遵循了的指导。我知道CoreNLP按以下顺序从盒子中加载三个NER模型： edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz 现在，我希望将我的NER模型包括在上面的列

浏览 0提问于2017-05-12得票数 6

回答已采纳

1回答

使用自定义数据训练Spacy的预定义NER模型，需要考虑复合因子、批次大小和损失值

python、nltk、spacy、named-entity-recognition

我正在尝试训练spacy NER模型，我有大约2600个段落的数据，每个段落的长度从200到800个单词不等。我必须添加两个新的实体标签，产品和规范。如果没有最好的替代方法，这种方法是不是很好呢？如果可以，那么有没有人能给我建议合适的复合因子和批量大小的值，并且在训练时，损失值应该在范围内，有什么想法吗？到目前为止，我得到的损失值在400-5之间。 def main(model=None, new_model_name='product_details_parser', output_dir=Path('/xyz_path/'), n_iter=20): &

浏览 9提问于2019-01-05得票数 2

1回答

EncoderDecoderModel转换解码器的分类器层

python、pytorch、huggingface-transformers

我正在尝试使用序列到序列模型进行命名实体识别.我的输出是简单的IOB标记，因此我只想预测每个令牌(IOB)的3个标签的概率。我正在尝试使用HuggingFace实现EncoderDecoderModel --使用DistilBert作为编码器，以BertForTokenClassification作为解码器。首先，我导入我的编码器和解码器： encoder = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased") encoder.save_pretrained("E

浏览 2提问于2021-10-25得票数 1

回答已采纳

1回答

无法使用CLI评估spacy 3.0中的自定义ner

python、spacy、spacy-3

我正在尝试从磁盘加载一个带有自定义管道的自定义预训练模型，作为spacy 3.0中的管道：工厂的代码是这样的： @CustomEng.factory("ner-crf") def create_my_component(nlp, name): crf_extractor = CRFExtractor().from_disk("path-to-model") return CRFEntityExtractor(nlp, crf_extractor=crf_extractor) 然后我将'ner-crf‘添加到我的语言类中，如下所示：

浏览 28提问于2021-04-25得票数 1

回答已采纳

2回答

我如何在bert预训练模型中获得最后一个transformer编码器的所有输出，而不仅仅是cls令牌输出？

neural-network、pytorch、text-classification、bert-language-model、huggingface-transformers

我使用的是pytorch，这是huggingface transformers link的模型 from transformers import BertTokenizerFast, BertForSequenceClassification bert = BertForSequenceClassification.from_pretrained("bert-base-uncased", num_labels=int(data['class'].nuniq

浏览 282提问于2020-12-09得票数 3

2回答

用Python实现斯坦福NLP中的实体识别

python、nlp、stanford-nlp

我使用的是使用Python的斯坦福核心NLP。我已经从这里获取了代码。这是代码： from stanfordcorenlp import StanfordCoreNLP import logging import json class StanfordNLP: def __init__(self, host='http://localhost', port=9000): self.nlp = StanfordCoreNLP(host, port=port, timeout=30000 , quiet=T

浏览 0提问于2018-06-18得票数 1

1回答

对自定义数据进行BERT的细化

tensorflow、deep-learning、nlp、text-classification、bert-language-model

我想训练一个21级文本分类模型使用Bert。但是我的训练数据很少，所以下载了一个与5类类似的数据集，包含200万个样本。验证准确率达98%左右。现在，我想使用这个模型作为我的小定制数据的预训练模型。但是我得到了shape mismatch with tensor output_bias from checkpoint reader错误，因为检查点模型有5个类，而我的自定义数据有21个类。 NFO:tensorflow:Calling model_fn. INFO:tensorflow:Running train on CPU INFO:tensorflow:*** Features ***

浏览 0提问于2019-05-04得票数 3

1回答

web播放器什么时候支持字幕文件？

官方文档、云直播

你好我是web视频点播用户，我的视频内容几乎都是英文的，针对中文用户希望能够增加类似于dvd那样的使用外挂字幕文件的支持。据我了解，H5的video标签是支持字幕的，那么我时使用腾讯的点播播放器播放视频怎样才能加载字幕文件呢？希望能够得到解决，谢谢！标题：Web 播放器 TcPlayer - 移动直播 - 产品文档 - 帮助与文档 - 腾讯云地址：https://cloud.tencent.com/document/product/454/7479

浏览 902提问于2018-02-08

1回答

阿尔伯特不收敛- HuggingFace

machine-learning、nlp、text-classification、transformer-model、huggingface-transformers

我正在尝试将经过预先训练的HuggingFace阿尔伯特转换器模型应用到我自己的文本分类任务中，但损失不会超过某个点。这是我的密码：在我的文本分类数据集中有四个标签，它们是： 0, 1, 2, 3 定义令牌程序 maxlen=25 albert_path = 'albert-large-v1' from transformers import AlbertTokenizer, TFAlbertModel, AlbertConfig tokenizer = AlbertTokenizer.from_pretrained(albert_path, do_lower_case=T

浏览 0提问于2020-06-20得票数 4

1回答

用于语义相似度的BERT嵌入

python、tensorflow、keras、bert-language-model

我早些时候发布了这个。我想要嵌入类似于这个视频，时间33分钟前。 1)我不认为我从CLS令牌中获得的嵌入与youtube视频中显示的内容类似。我试着进行语义相似，结果很糟糕。有人能确认我得到的嵌入是否与视频35.27标记中提到的嵌入相似吗？ 2)如果上述问题的答案是“不相似的”，那么如何使用我编写的代码获得我正在寻找的嵌入呢？ 3)如果第一个问题的答案是“它们是相似的”，那么为什么我会得到可怕的结果呢？我需要使用更多的数据来完成吗？更新1 我用来微调的代码如下所示。它来自于这个。对该代码进行了很少的更改，以返回CLS嵌入。这些变化是基于给我的的答案。 train_InputExamples

浏览 1提问于2020-04-02得票数 9

1回答

命名实体识别在实践中的应用

python、entity-framework、nlp、named-entity-recognition、spacy

我是一个尝试学习的NLP新手，我想更好地理解命名实体识别(NER)是如何在实践中实现的，例如在流行的python库(如 )中。我理解它背后的基本概念，但我怀疑我遗漏了一些细节。例如，从文档中不清楚对文本和注释数据进行了多少预处理；以及使用了什么统计模型。你知道如果：为了起作用，在训练模型之前，文本必须经过分块，对吗？否则它就不能执行任何有用的操作了？在对模型进行培训之前，文本和注释是否典型地规范化了？所以，如果一个被命名的实体处于句子的开头或中间，它仍然可以工作吗？特别是在spaCy中，事情是如何具体实现的？它是一个嗯，CRF或其他什么东西是用来建立模型？很抱歉

浏览 2提问于2018-01-16得票数 0

回答已采纳

1回答

来自变压器和多类问题的BertForSequenceClassification上的不匹配大小

python、deep-learning、pytorch、huggingface-transformers、bert-language-model

我刚刚在一个由产品和标签(部门)组成的数据集上为一家电子商务网站训练了一个BERT模型。这是一个多类问题。我使用BertForSequenceClassification来预测每个产品的部门。我把它分成了训练和评估，我使用了pytorch的dataloader，我得到了一个很好的分数，没有过拟合。现在我想在一个新的数据集上尝试它，以检查它如何在看不见的数据上工作。但我无法实现加载模型并应用于新的数据集。我得到以下错误： RuntimeError: Error(s) in loading state_dict for BertForSequenceClassification: si

浏览 366提问于2021-09-15得票数 3

1回答

无法识别使用python的两个或多个标签

python、machine-learning、spacy

我对spacy和python很陌生，我正在使用python和nltk来训练我自己的spacy模型，这里是我的代码，我在这里训练数据和测试数据，如果我提供与文本数据相同的测试数据，但是我无法识别超过2个标签，而且每次我编译代码时标签识别是不同的和不正确的，我已经参考了spacy网站，但是我无法找到解决方案。请救救我！ from __future__ import unicode_literals, print_function import plac import random from pathlib import Path import spacy # new entity label

浏览 1提问于2018-04-02得票数 2

1回答

如何在预先训练的BERT模型的基础上添加多类多标签层？

deep-learning、pytorch、bert-language-model、huggingface-transformers、transfer-learning

我正在尝试使用预先训练的BERT模型来完成一个多任务、多类句子分类任务，这个模型来自拥抱式变压器库。我尝试从那里使用BERTForSequenceClassification模型，但问题是我无法将它扩展到多个任务。通过这个例子，我将努力使它更具有信息性。假设我们有四个不同的任务，对于每个句子和每个任务，我们都有如下的标签： A：'a‘，'b’，'c‘，'d’B：'e‘，'f’，'g‘，'h’C：'i‘，'j’，'k‘，'l’D：'m‘，'n’，'o‘，'p’ 现在，

浏览 1提问于2020-12-14得票数 0

回答已采纳

1回答

CUDA错误:使用CUBLAS_STATUS_INVALID_VALUE训练BERT模型时的HuggingFace错误

python、pytorch、sentiment-analysis、bert-language-model

我正在使用BERT模型对蒸汽评论数据集进行情绪分析，其中我有两个标签:正标签和否定标签。我用两个线性层对模型进行了精细的调整，代码如下所示。 bert = BertForSequenceClassification.from_pretrained("bert-base-uncased", num_labels = len(label_dict), output_attentions

浏览 22提问于2021-07-14得票数 2

回答已采纳

1回答

未初始化的预训练BERT模型的权重

tensorflow、nlp、pytorch、bert-language-model、huggingface-transformers

我正在使用 (点燃)加载和分析一个伯特模型，我预先培训了一个新的任务。但是，当我用传递给它的经过预先训练的模型的路径启动LIT脚本时，它无法初始化权重，并告诉我： modeling_utils.py:648] loading weights file bert_remote/examples/token-classification/Data/Models/results_21_03_04_cleaned_annotations/04.03._8_16_5e-5_cleaned_annotations/04-03-2021 (15.22.23)/pytorch_model.bin

浏览 1提问于2021-03-10得票数 0

回答已采纳

1回答

使用CLI命令训练BERT

python、machine-learning、nlp、bert-language-model、huggingface-transformers

我已经从transformer存储库下载了HuggingFace BERT模型，找到了here，并希望通过使用run_ner.py脚本在自定义NER标签上训练模型，因为它在“命名实体识别”一节中被引用为here。我在代码中定义了模型(“bert-base-德语-大小写”)、数据(“数据/语句_数据.txt”)和标签(“data_dir /labels.txt)”作为默认值。现在，我在命令行中使用以下输入： python run_ner.py --output_dir="Models" --num_train_epochs=3 --logging_steps=100 --d

浏览 76提问于2020-11-02得票数 0

回答已采纳