如何使用Spacy NER模型训练全新的实体而不是预先训练的实体？_Spacy NER -训练一个只有一个实体集合的模型_有没有实际使用(而不是训练) NER的预训练BERT模型的例子？ - 腾讯云开发者社区

python、nlp、spacy、named-entity-recognition、doccano

我想训练一个spacy自定义NER模型，哪一个是最好的选择？列车数据已准备就绪(doccano) 选项1.使用现有的预先训练的spacy模型，并使用自定义NER?进行更新。选项2.使用带有自定义NER的spacy.blank()创建一个空模型？我只想在文本中标识我的自定义实体，其他类型的实体不是necessary...currently

浏览 26提问于2020-08-25得票数 0

2回答

如何使用Spacy NER模型训练全新的实体而不是预先训练的实体？

python、deep-learning、nlp、spacy、named-entity-recognition

我如何做迁移学习，例如，采用预训练的Spacy NER模型，并使其学习特定于我的用例的新实体？为此，我有100个新的带注释的训练样本。新的重新训练的模型应该只预测新的实体，而不是预训练的spacy模型中的任何现有实体。只是在现有模型中添加/更新新实体，并在预测期间忽略旧实体，这是没有意义的。这个official example描述了如何将新的实体添加到现有的预训练实体中，但这不是我想要的。我也有很少的例子，例如100个完全从头开始构建一个新的NER模型。编辑:我要识别非结构化文档中的所有帐号。示例(“我想更改与我的帐户12345对应的地址。请让我知道怎么做。”34，39，‘accou

浏览 40提问于2020-01-21得票数 0

1回答

是否可以在现有的SpaCy模型上减少用于训练的NER模型？

spacy

我已经有了一个现有的spaCy模型，我想在运行时用额外的训练数据来改进它。例如，我的训练模型中的训练dataSet如下所示： text="Anna lives in Munich and works at BMW" entity: name=Anna entity: city=Munich entity: company=BMW 在我的实现中，在开始新的训练之前，我从现有模型中获取ner： nlp = spacy.load(modelPath) ner = nlp.get_pipe('ner') 然后我用新的TrainingData训练我现有

浏览 2提问于2020-07-29得票数 0

2回答

在spaCy中加入词典(地名录)的理想方法是什么？

python、nlp、named-entity-recognition、spacy

我目前正致力于替换一个基于nltk实体提取的系统，并结合regexp匹配，其中我有几个命名实体字典。字典实体都是常见的类型(人员(雇员)等)。以及定制类型(例如技能)。我想使用预先训练的spaCy模型，并以某种方式包括我的字典，以提高NER的准确性。以下是我对可能的方法的看法：使用spaCy的Matcher API，遍历字典，用回调添加每个短语来添加实体？我刚刚发现了spacy查找，这似乎是提供大量单词/短语来匹配的简单方法。但如果我想要模糊匹配呢？是否有一种方法直接添加到词汇表中，从而通过Bloom过滤器/n克字向量进行一些模糊匹配，或者是否有适合这种需要的扩展？否则，我想

浏览 0提问于2018-02-14得票数 11

1回答

训练自定义NER模型

python、machine-learning、nltk、spacy、named-entity-recognition

我一直在一些文本上训练我的NER模型，并试图在其中找到具有自定义实体的城市。示例：- ('paragraph Designated Offices Party A New York Party B Delaware paragraph pricing source calculation Market Value shall generally accepted pricing source reasonably agreed parties paragraph Spot rate Spot Rate specified paragraph reasonably agreed

浏览 1提问于2019-12-03得票数 1

2回答

Spacy从训练模型中提取命名实体关系

python、nlp、spacy、named-entity-recognition、named-entity-extraction

如何使用Spacy创建一个新的名称实体“病例”-在传染病病例数量的上下文中，然后提取这与病例基数之间的依赖关系。例如，在以下文本中，“1995年10月9日至11月5日期间报告了879例病例，其中4例死亡。”我们想要提取"879“和”case“ 在Spacy的示例文档页面上，按照"Training a additional entity type“的代码：我使用他们现有的预训练的"en_core_web_sm“英语模型，成功地训练了一个名为"CASES”的附加实体： from __future__ import unicode_literals, print

浏览 6提问于2020-03-10得票数 1

1回答

Spacy NER自定义训练和预训练模型的置信度评分

python、spacy

我在spacy文档中看到，NER实体的信心评分是在最近的版本中推出的。我正在使用spacy==3.1.2。我尝试了下面的代码，以找到信心得分，但我得到了一个错误。此外，是否有可能为自定义和预先训练的模型找到信心评分。码 nlp = spacy.load("output/model-best") test_data = 'Sample data here' doc = nlp(test_data) spans = doc.spans["spancat"] # SpanGroup print(spans.attrs["scores"

浏览 5提问于2021-10-22得票数 1

1回答

如何创建增量式NER培训模型(附加在现有模型中)？

machine-learning、stanford-nlp、spacy

我正在培训定制命名实体识别(NER)模型使用斯坦福NLP，但问题是，我想再培训模型。示例：假设我训练了xyz模型，然后我将在一些文本上测试它，如果模型检测到了什么错误，那么我(最终用户)将纠正它，并且希望重新训练(附加模式)校正文本上的模型。斯坦福不提供再培训设施，所以我转向的 spacy 库，在那里我可以重新培训模型的方法，在使用spacy重新训练模型之后，我可以将新的实体添加到现有的model.But中，它凌驾于现有的知识(即现有的培训数据)之上，只显示与最近的培训相关的结果。想想，我用1000 records.after训练了一个技术标签的模型，让我说我已经在现有的受过训练的mo

浏览 6提问于2017-09-08得票数 3

1回答

用Spacy NER模型的反例来改进训练

python、spacy

我已经为spacy的ner模型提供了一组GoldParse对象进行训练。我现在想做的是评估它在新句子上的结果，并将每个识别的实体标记为“好”或“坏”，然后将这些信息纳入新的一批训练中。这个是可能的吗？ner模型如何从负样本中学习？

浏览 6提问于2018-03-06得票数 3

回答已采纳

1回答

rasa小鸭模块

config、rasa-nlu、duckling

我试着基于rasa_nlu训练我的机器人。下面是我的配置文件，我有问题，因为像“下个月”这样的实体被ner_spacy识别为不是时间数据。我希望这种类型的实体只被小鸭模块识别。谢谢语言："en“项目："nav-os”管道：-名称："nlp_spacy“模型："en”-名称："ner_spacy“-名称："tokenizer_spacy”-名称："intent_entity_featurizer_regex“-名称："intent_featurizer_spacy”-名称："ner_synonyms“-名称："i

浏览 8提问于2018-07-18得票数 0

1回答

在NER基础模型之外添加自定义实体

machine-learning、nlp、spacy、named-entity-recognition

我正在使用spacy来训练我自己的NER模型。除了由spacy basic 'en_core_web_sm‘模型训练的实体(ORG、PERSON、DATE等)之外，我还想添加我自己的实体。我使用'en_core_web_sm‘作为我的基本模型来训练我的模型，但是这个模型只能检测我自己的自定义实体，而不能检测基本实体。有没有办法做到这一点？谢谢。

浏览 17提问于2019-09-10得票数 1

回答已采纳

2回答

如何在现有的实体标尺中添加模式？

python、spacy、named-entity-recognition

我的spacy版本是2.3.7。我有一个现有的自定义NER模型和实体规则管道。我想更新和重新培训这个现有的管道。创建实体标尺管道的代码如下- ruler = EntityRuler(nlp) for i in patt_dict: ruler.add_patterns(i) nlp.add_pipe(ruler, name = "entity_ruler") 其中patt_dict是我制作的原始模式字典。现在，在完成训练之后，现在我有了更多的输入数据，并且希望用新的输入数据来更多地训练模型。当我稍后加载spacy模型并希望用更多的输入数据重新训练它时，我如何修改上面的

浏览 4提问于2021-07-27得票数 1

回答已采纳

1回答

如何在Spacy中创建具有多模型的NER管道

python、spacy、named-entity-recognition

我正试着训练新的实体为斯佩西纳。我尝试将我的新实体添加到现有的spacy 'en‘模型中。然而，这影响了'en'和我的新实体的预测模型。因此，我建立了一个空白模型并训练了实体识别。这个效果很好。然而，它只能预测我训练过的对象，而不能预测常规的spacy实体识别。比如说我把“马”训练成动物实体。对于给定的文本 txt ='Did you know that George bought those horses for 10000 dollars?' 我期待着下列实体得到认可 George - PERSON horses - ANIMAL 10000

浏览 0提问于2019-02-24得票数 15

3回答

如何利用Spacy训练新模型并将其集成到原始模型

model、named-entity-recognition、spacy

我正在尝试用我自己的数据训练纳使用Spacy。我的问题是如何将我受过训练的NER集成到原始模型中？这样就可以方便地不断地训练和使用我的应用程序。我没有找到任何样本。我在下面找到了一些类似的例子来训练NER，但似乎所有这些都没有保存经过训练的模型，并将其集成回Spacy中。有些保存在内存中，有些保存在其他文件夹中.那么，如何以适当的方式来满足我的需求呢？谢谢！我用的是spacy 1.7.3

浏览 1提问于2017-04-13得票数 5

2回答

带有SpaCy的自定义POS标记

nlp、named-entity-recognition、spacy

对NLP来说非常新，尤其是NER。我试图在自定义数据集上训练一个NER模型。这是待售房屋的数据集。作为实体的一部分，我正在训练模型来提取reference数字。它们的长度是可变的(但通常在4-9之间)，看起来像G55L7或LPP01Z1-32。我怎样才能给这些实体一个新的"POS标签“，据我所知，在SpaCy的默认列表中找不到匹配它们的任何东西？理想情况下，我希望将其与已有的NER模型一起进行培训，这样我也可以提取SpaCy已经支持的SpaCy。

浏览 0提问于2019-10-10得票数 0

1回答

SPACY -关于单词向量和tok2vec的混淆

python、nlp、spacy、fasttext

如果你能帮我理解一些关于Spacy的基本概念，我会很有帮助的。我知道一些spacy模型有一些预定义的静态向量，例如，对于西班牙模型，这些是由FastText生成的向量。我还了解到有一个tok2vec层，它从令牌生成向量，例如用作模型的NER组件的输入。如果以上所述是正确的，那么我有一些问题： NER组件也使用静态向量吗?如果是，那么component?层在哪里发挥作用?如果不是，那么使用lg或md模型是否有任何优势，如果您只打算将模型用于例如NER component？。是已经为预先培训过的下载模型(例如西班牙语)而训练的tok2vec层吗?如果我替换预训练模型的NER组件，它是否保持t

浏览 1提问于2020-10-07得票数 6

回答已采纳

1回答

为什么默认实体来源于另一种语言模型(Spacy 3.0)？

python、nlp、spacy

因此，我使用Spacy 3.0来训练基本上所有管道与自定义数据。奇怪的是，Spacy似乎从另一个模型(可能是en_core_web_md )中获取了NER管道的实体。所以，如果我在spacy中输入“谁是兵营奥巴马”这个句子，它就会检测到个人实体的名字，这不是我想要的行为，因为我只想和自己的实体一起工作。不过，我似乎找不出它为什么要来源这些实体，这是我的配置： [paths] train = "trainer/data/sent_train.spacy" dev = "trainer/data/sent_train.spacy" vectors = "e

浏览 6提问于2022-03-27得票数 1

1回答

如何更新现有的spacy模型？

python、spacy

我正在为我的硕士论文开发一个命名实体识别功能。我想利用"en_core_web_sm“语言包来训练识别产品的能力。在训练模型之前，未经训练的模型("en_core_web_sm")能够识别不同的实体，如“PERSON”、“ORG”、“GPE”、“DATE”、……在“验证句子中。产品偶尔会被识别，但标签通常是不正确的。在训练模型之后，只有'PRODUCT‘类型的实体被识别，而没有其他实体，尽管应该有个人，组织，...被识别。我感觉我的模型忘记了其他实体，在训练之后只“知道”了产品实体。这是我的训练代码： #nlp = spacy.load("en_

浏览 22提问于2021-06-23得票数 1

回答已采纳

1回答

如何使用spacy训练将实体添加到现有的自定义NER模型中？(Spacy v3.0)

python、machine-learning、nlp、spacy、named-entity-recognition

我目前正在实现一个自定义NER模型界面，用户可以与前端应用程序交互，以添加自定义实体来训练spacy模型。我想要使用空间训练(CLI)来接受现有模型(自定义NER模型)，并将用户指定的关键字和实体添加到该模型中。(而不是再次训练整个模型)。我在文件里找不到这个。例如，假设我有一个模型，它已经被训练成一个定制的食物实体。(比萨饼、意大利面、面包等…)。现在我想采用现有的模式，并为一个名为“饮料”的新实体进行培训，其中包括可口可乐、百事可乐、果汁等关键词…。对spacy v3.0使用spacy列命令。我目前使用的spacy列车命令如下： > python -m spacy train

浏览 5提问于2021-06-22得票数 2

回答已采纳

1回答

如何训练几个NER模型(Spacy)

python、spacy、spacy-3

我正在训练一个名为实体识别的自定义模型，我创建了config.cfg和train.spacy文件，其中包括，我使用它作为预先训练的向量en_core_web_lg [paths] train = null dev = null vectors = "en_core_web_lg" init_tok2vec = null 然后我用以下方法训练模型 !python -m spacy train config.cfg --output ./output --paths.train ./train.spacy --paths.dev ./train.spacy 这是可行的，我可以看到输

浏览 11提问于2022-10-27得票数 0

回答已采纳

3回答

在SpaCy中用其标签替换实体

nlp、spacy、named-entity-recognition

SpaCy是否可以用它的标签替换SpaCy NER检测到的实体？例如：我在玩苹果Macbook的时候正在吃苹果。我用SpaCy训练了NER模型来检测“水果”实体，该模型成功地检测出第一个“苹果”为“水果”，而不是第二个“苹果”。我想对我的数据进行后处理，用它的标签替换每一个实体，所以我想用“水果”代替第一个“苹果”。这句话将是“，我在玩苹果Macbook.时正在吃水果” 如果我简单地使用regex，它将把第二个"Apple“替换为”水果“，这是不正确的。有什么聪明的办法吗？谢谢!

浏览 5提问于2019-11-05得票数 13

回答已采纳

1回答

如何使用100万个标记句子来提高从头开始实现的ner模型的速度

nlp、spacy、named-entity-recognition

我想使用spacy的NER模型从头开始训练一个使用100万个句子的模型。该模型只有两种类型的实体。这是我正在使用的代码。因为我不能共享数据，所以我创建了一个虚拟数据集。我的主要问题是模型训练时间太长。如果你能强调我代码中的任何错误，或者建议其他方法来加速训练，我将不胜感激。 TRAIN_DATA = [ ('Ich bin in Bremen', {'entities': [(11, 17, 'loc')]})] * 1000000 import spacy import random from spacy.util import mi

浏览 13提问于2019-05-04得票数 2

1回答

在Spacy培训两个连续的NER管道

python、spacy、named-entity-recognition、spacy-3

我正在进行一个训练分类器以识别文本中引文的项目。我们所处理的引文往往是非常混乱的。以下是一些引用的例子：见A册第3章第7段见A书第3章第7段见A书第7段的“某些章节标题”一章我们已经确定了少数实体往往出现在这些引文中。例如，“书名”、“章号”、“章名”、“段号”。该项目分为两个阶段：文本引文的二元分类引文中引文实体的分类 Spacy (我们正在使用v3)是否有可能有两个连续的NER管道？我希望分类器首先标记引文，然后标记每个引文中的实体。我能够用下面的代码用两个NER管道实例化一个模型： from spacy.lang.en import E

浏览 3提问于2021-04-25得票数 1

回答已采纳

1回答

使用Spacy NER训练多词动词和名词实体

spacy

我遇到的所有NER训练实例都是名词，但是否可以使用Spacy NER训练动词和名词组合的实体。例如“搅拌锅”。我是先使用基于名词的NER，然后在此类短语上训练嵌套NER，还是直接在Spacy NER中训练该短语。我猜答案将取决于Spacy NER是否将POS和依赖功能作为其培训的一部分。

浏览 5提问于2018-10-29得票数 0

1回答

在Rasa培训数据中使用spaCy实体

spacy、rasa-nlu

我试图用Rasa创建一个简单的程序，它从文本输入中提取(法语)街道地址。按照Rasa ()中的建议，我希望使用spaCy来进行地址检测。我看到()相应的spaCy预构建实体将是LOC。然而，不明白如何使用这个实体创建训练数据集. 下面是我当前JSON培训数据集的摘录： { "text" : "je vis au 2 Rue des Platanes", "intent" : "donner_adresse", "entities" : [ { &

浏览 0提问于2018-03-16得票数 3

回答已采纳

1回答

如何使用spaCy创建新实体并仅从关键字列表中学习

python、python-3.x、machine-learning、nlp、spacy

我试图使用创建一个新的实体分类“物种”，并列出一个物种名称，例如，他能找到吗？我找到了一个教程，用于从 (Github代码)中训练新的实体类型。然而，问题是，我不想手动为每个物种的名字创建一个句子，因为这将是非常耗时的。我创建了下面的培训数据，如下所示： TRAIN_DATA = [('Bombina',{'entities':[(0,6,'SPECIES')]}), ('Dermaptera',{'entities':[(0,9,'SPECIES')]}), .... ] 我创建培训集

浏览 0提问于2018-05-29得票数 14

1回答

在spaCy 3.0中使用spaCy优化NER模型

spacy-3

我想将spaCy库中的en_core_web_trf模型用于Named entity recognition。但是，guide for training a自定义模型不包含用于优化预训练模型的信息。如何在spaCy v3.0中对NER模型进行微调？

浏览 53提问于2021-11-13得票数 0

回答已采纳

1回答

有没有什么办法可以将经过eBrevia训练的模型加载到CoreNLP或Spacy中？

nlp、stanford-nlp、spacy、named-entity-recognition、pycorenlp

我有一个来自eBrevia的经过训练的名称实体识别(NER)模型。我想知道是否有一种方法可以使用Python或Java编程将其加载到CoreNLP或Spacy中。编辑:如果预训练的模型是一个pickle模型，有没有办法使用Corenlp或Spacy来加载它？提前感谢！

浏览 12提问于2019-10-03得票数 0

1回答

错误加载训练的en_core_web_trf spacyV3 NER模型

nlp、spacy

加载经过预训练的空间模型对定制数据进行细化 spacy.require_gpu() nlp = spacy.load("en_core_web_trf",exclude=['tagger', 'parser', 'attribute_ruler', 'lemmatizer']) 加载验证时获取错误 model=spacy.load(category_output_dir + "/%s" % itn,exclude=['tagger', 'parser', 'a

浏览 2提问于2020-11-23得票数 2

1回答

基于现有模型的spaCy v3训练器或在现有模型中添加自定义训练器

python、machine-learning、spacy、named-entity-recognition

在spaCy < 3.0中，我能够在经过训练的en_core_web_sm模型中训练NER组件 python -m spacy train en model training validation --base-model en_core_web_sm --pipeline "ner" -R -n 10 具体来说，我需要标记器和en_core_web_sm模型的解析器。spaCy的新版本不再使用这些命令，它们需要在配置文件中设置。根据spaCy的网站，这些组件可以与相应的源代码一起添加，然后在配置文件的培训部分插入到frozen_component (我将在这个问题的末尾

浏览 0提问于2021-02-07得票数 5

2回答

Spacy中实体关系抽取器的标注格式

spacy、data-annotations、named-entity-recognition

我试图得到实体之间的关系，因为我们已经为NER建立了使用spacy的模型。我找到了relation_extractor可训练组件来获取实体之间的关系。我对relation_extractor非常陌生，能够理解如何训练数据。但不幸的是，我无法找到注释所需的格式，也找不到任何资源。有人能帮我处理注释数据的格式吗。会很有帮助。参考文件：提前谢谢。

浏览 12提问于2022-01-19得票数 2

1回答

使用自定义数据训练Spacy的预定义NER模型，需要考虑复合因子、批次大小和损失值

python、nltk、spacy、named-entity-recognition

我正在尝试训练spacy NER模型，我有大约2600个段落的数据，每个段落的长度从200到800个单词不等。我必须添加两个新的实体标签，产品和规范。如果没有最好的替代方法，这种方法是不是很好呢？如果可以，那么有没有人能给我建议合适的复合因子和批量大小的值，并且在训练时，损失值应该在范围内，有什么想法吗？到目前为止，我得到的损失值在400-5之间。 def main(model=None, new_model_name='product_details_parser', output_dir=Path('/xyz_path/'), n_iter=20): &

浏览 9提问于2019-01-05得票数 2

1回答

自定义NER模型中实体的最大限制是什么？

python、machine-learning、spacy、bert-language-model、flair

我们可以在基于spacy或bert的自定义NER模型中拥有的实体的最大极限是什么？我见过网络上的例子，它们被训练成每个模型最多有10个自定义实体，甚至Ontonotes数据集也有18个实体，那么在一个NER模型中拥有一定数量的实体会影响模型的学习能力和性能吗？

浏览 6提问于2022-05-08得票数 1

1回答

使用Spacy进行命名实体识别的交叉验证

python-3.x、machine-learning、nlp、spacy

我正在尝试在5000万个样本上训练一个自定义的NER模型。我正在使用20次迭代的进行建模。我想知道我是否应该使用交叉验证来获得更准确的样本准确性。如果是，那么交叉验证步骤应该在哪里进行？如果没有，那么我如何拆分/分发我的训练和测试数据，因为我正在使用注释和6个自定义实体，并且很难跟踪每个训练和测试数据中带注释的标签的百分比，因为它是均匀分布的。这是我用来训练的代码- def train_spacy(data, iterations): TRAIN_DATA = data # create blank Language class nlp = spacy.blank(

浏览 3提问于2019-08-01得票数 1

1回答

利用Spacy方法预测NER实体的置信度

python、nlp、spacy、named-entity-recognition

我试图使用自定义培训的NER模型预测实体，使用spacy。我读过，每个实体的信心分数都可以使用spancat获得。但我对如何让这件事发挥作用有点困惑。根据我的理解，我们必须使用spancat组件来训练管道。因此，在培训过程中，在配置文件中有一个段， [nlp] lang = "en" pipeline = ["tok2vec","ner"] batch_size = 1000 我们是不是该把这个改成 [nlp] lang = "en" pipeline = ["tok2vec","ner","

浏览 0提问于2021-10-23得票数 1

回答已采纳

2回答

使用多处理的空间训练器

python、nlp、python-multiprocessing、spacy、named-entity-recognition

我正在尝试用spacy来训练一个定制的ner模型。目前，我有超过2k的培训记录，每一篇文章包含100多个单词，至少每个记录有2个实体。我运行了50次迭代。完全训练需要两个多小时。有什么方法可以使用多处理来训练吗？会否改善训练时间？

浏览 2提问于2020-02-28得票数 2

3回答

将NER SpaCy格式转换为IOB格式

nlp、spacy、named-entity-recognition

我有已经以SpaCy格式标记的数据。例如： ("Who is Shaka Khan?", {"entities": [(7, 17, "PERSON")]}), ("I like London and Berlin.", {"entities": [(7, 13, "LOC"), (18, 24, "LOC")]}) 但我想尝试使用任何其他NER模型来训练它，例如BERT-NER，它需要IOB标签。有没有SpaCy数据格式到IOB的转换代码？谢谢!

浏览 0提问于2020-01-14得票数 4

1回答

格式化SpaCy NER的培训数据集

json、format、training-data、named-entity-recognition、spacy

我想用我自己的实体为NER训练一个空白模型。为此，我需要使用dataset，该数据集目前采用.csv格式，并以以下格式提供实体标记(我将为每个相关列提供一个示例行)：栏:句子价值:我想要苹果列:数据价值:想要；@命令；2；6，‘苹果’；@水果；7；13‘ 栏:实体价值:我“命令”水果列: entity_types 值：@bot/@命令；@bot/“食品/”水果为了训练SpaCy的NER，我需要以下形式的json训练数据： TRAIN_DATA = [ ('Who is Shaka Khan?', { 'entiti

浏览 3提问于2017-11-22得票数 6

回答已采纳

2回答

培训学生时，西班牙语是独立的吗？

python、nlp、spacy

如果我完全从头开始训练一个新的模型，语言重要吗？在API中，我设置了语言，但我也给出了命名实体的范围。命令行格式更进一步，我为每个句子给出了每个标记的NER标签。例如，我是否可以使用ICU标记日语，标记这些令牌，然后将其提供给Spacy？

浏览 1提问于2018-04-27得票数 0

回答已采纳

1回答

自定义Spacy NER模型的总体F得分与单个实体的F得分之间的巨大差异

python、machine-learning、nlp、spacy

我正在使用Spacy训练一个自定义NER模型，该模型使用6个实体的5000个文本条目的样本。当在一个看不见的样本(500个文本条目)上评估训练后的模型时，我为整个模型(93.8)获得的F分数在任何单个实体的F分数之间有很大差异。有人能帮我理解整体F分数是如何计算的吗?为什么整体F分数和单个实体分数之间有这么大的差异？我使用Spacy构建了自己的自定义命名实体识别(NER)模型。我的训练数据集的大小是5000，其中有6个实体。此外，我在500个样本上测试了我的模型，并使用Scorer和GoldParse对模型进行了评估。下面是我用来评估测试数据性能的代码： def evaluate(ner_

浏览 14提问于2019-07-31得票数 1

回答已采纳

1回答

使用IOB标签方案为影评数据集自定义Spacy NER

machine-learning、nlp、spacy

我之前已经使用CRF++模型来识别电影评论数据集中的NER。然而，我发现spacy在使用和可视化方面非常有效。然而，这里的问题是，我如何在spacy中合并CRF++模型？如果这是不可能的，我如何使用IOB标签训练Spacy NER模型来满足我的需求？

浏览 1提问于2018-05-27得票数 0

2回答

如何从Spacy NER模型中求出每一个实体的预测概率？

python、deep-learning、nlp、spacy、named-entity-recognition

我使用这个从零开始训练一个NER模型，使用我自己的训练样本。当我在新文本上使用这个模型时，我想得到每个实体的预测概率。 # test the saved model print("Loading from", output\_dir) nlp2 = spacy.load(output\_dir) for text, \_ in TRAIN\_DATA: doc = nlp2(text) print("Entities", [(ent.text, ent.label\_) for ent in doc.

浏览 3提问于2020-01-23得票数 5

1回答

在空间中，我应该先使用tok2vec吗？

nlp、model、pipeline、spacy、named-entity-recognition

我目前正在训练一个命名实体识别的模型，我无法找到如何构造spacy中的管道以获得更好的结果。在ner组件之前使用tok2vec是否有意义？

浏览 15提问于2022-09-28得票数 0

1回答

如何分析使用Spacy训练的NER？

nlp、spacy、named-entity-recognition

这是一个简单的代码，它是从教程文档中提取的(或多或少)。一旦我使用下面的训练代码训练了NER模型，我就在for循环中使用nlp(sentence).ents来获取命名实体。如您所见，我使用了一个空白模型spacy.blank('en') --这是因为我要添加新的实体。但是没有从测试集中检测到任何实体。 import spacy import random from spacy.util import compounding from spacy.util import minibatch def get_batches(train_data, model_type):

浏览 2提问于2019-01-28得票数 1

1回答

tensorflow模型的再训练

machine-learning、tensorflow、named-entity-recognition

我正在用张量流编写的自定义命名实体识别(，NER)模型( NeuroNER )训练模型，我能够训练一个模型，它的性能很好，但是当我重新训练它时，它显示了不正确的结果，它纠正了它们，但是它的影响/忘记了以前的观察结果，它显示了正确的结果。我希望在线再培训.I尝试使用stanfordNLP，Spacy和现在的张量流。请建议一个更好的方法来达到预期的目标。谢谢

浏览 3提问于2017-10-06得票数 0

1回答

Spacy v2.0.1自定义NER:如何改进现有模型的培训

anaconda、spacy、python-3.x

我第一次用bellow训练的数据实现了自定义NER，它给了我很好的名字和PrdName预测。我提到了暗号。 if __name__ == '__main__': TRAIN_DATA = [ ('My Name is Rajesh', {'entities': [(11, 17, 'Name')]}), ('My Name is Bakul', {'entities': [(11, 16, 'Name')]}),

浏览 0提问于2020-01-02得票数 1

1回答

尝试训练spacy NER管道以添加新命名实体时出现意外的ner数据类型

nlp、spacy、named-entity-recognition

我正在尝试向spacy添加一个新的命名实体，但我无法获得用于ner训练的示例对象的良好示例，并且我得到了一个值错误。下面是我的代码： import spacy from spacy.util import minibatch, compounding from pathlib import Path from spacy.training import Example nlp=spacy.load('en_core_web_lg') ner=nlp.get_pipe("ner") TRAIN_DATA=[('ABC is a worldwide or

浏览 13提问于2021-02-25得票数 1

回答已采纳

1回答

Spacy3.0上的自定义NER - ValueError

python、python-3.x、spacy、spacy-3

我正在尝试训练Spacy3.0来识别新的非目标实体。我完全按照本文中指定的方式执行操作： for text, annot in tqdm(TRAIN_DATA): # data in previous format doc = nlp.make_doc(text) # create doc object from text ents = [] for i in annot["entities"]: start = i[0] end = i[1] label = i[2] spa

浏览 0提问于2021-03-30得票数 1

2回答

是否可以在spaCy中的实体链接候选生成中使用NER-Label？

python、spacy、named-entity-recognition、entity-linking

我想使用spaCy进行实体链接(EL)。我已经在我的领域特定语料库上训练了一个带有自定义标签的spaCy命名实体识别(NER)模型。但是，我的以下示例将使用常规实体标签PERSON和LOCATION。在知识库( KB )中设置别名，知识库返回识别出的实体出现的候选，例如"Paris“的候选可以是维基数据条目Q47899 (巴黎希尔顿)、Q7137357 (巴黎西门)、Q5214166 (丹·巴黎)、Q90 (法国首都巴黎)或Q830149 (巴黎，美国得克萨斯州拉马尔县首府)。我的问题与已识别的实体标签有关。如果NER将"Paris“识别为人称，则从候选人中排除Q90 (法

浏览 6提问于2020-10-09得票数 1

1回答

从零开始在CoNLL 2003数据上训练spaCy的NER模型得到了非常奇怪的结果

machine-learning、nlp、training-data、spacy、named-entity-recognition

我正在尝试从零开始使用spaCy来训练NER模型。我想首先在上试用它，因为它被广泛用作NER系统的基线。下面是我运行的命令： spacy convert -c ner train.txt valid.txt test.txt spacyConverted cd spacyConverted python -m spacy train en trained train.txt.json valid.txt.json --no-tagger --no-parser mkdir displacy python -m spacy evaluate trained/model-final test.t

浏览 1提问于2018-07-26得票数 0