spacy v3中的训练NER需要在命令行中使用dev.spacy_在spaCy v3中使用基本模型训练自定义NER组件_使用Spacy训练NER从简历中提取技能。什么是转换中的U-实体名称 - 腾讯云开发者社区

python、named-entity-recognition、spacy-3

我想使用spaCy v3训练自定义NER模型。我准备了训练数据，并使用了以下脚本 import spacy from spacy.tokens import DocBin nlp = spacy.blank("en") # load a new spacy model db = DocBin() # create a DocBin object for text, annot in tqdm(TRAIN_DATA): # data in previous format doc = nlp.make_doc(text) # create doc object from

浏览 63提问于2021-06-13得票数 1

回答已采纳

2回答

spacy v3中的训练NER需要在命令行中使用dev.spacy

python、spacy-3

我正在尝试在spacy v3中准备一个自定义的ner模型。从训练的角度来看，与v2相比，V3有了很大的变化。我使用en_web_lg的默认配置。我已经使用convert命令准备了训练数据(training.spacy)。但是，训练命令需要一个dev.spacy文件。不确定dev.spacy中需要哪些数据。这是在询问training.spacy文件的纯文本语料库吗？但是有没有办法将纯文本文件转换为spacy格式呢？来自spacy站点的命令- python -m spacy train config.cfg --output./output--paths.train./Train.spac

浏览 72提问于2021-04-08得票数 1

回答已采纳

1回答

在Spacy培训两个连续的NER管道

python、spacy、named-entity-recognition、spacy-3

我正在进行一个训练分类器以识别文本中引文的项目。我们所处理的引文往往是非常混乱的。以下是一些引用的例子：见A册第3章第7段见A书第3章第7段见A书第7段的“某些章节标题”一章我们已经确定了少数实体往往出现在这些引文中。例如，“书名”、“章号”、“章名”、“段号”。该项目分为两个阶段：文本引文的二元分类引文中引文实体的分类 Spacy (我们正在使用v3)是否有可能有两个连续的NER管道？我希望分类器首先标记引文，然后标记每个引文中的实体。我能够用下面的代码用两个NER管道实例化一个模型： from spacy.lang.en import E

浏览 3提问于2021-04-25得票数 1

回答已采纳

1回答

使用Spacy NER训练多词动词和名词实体

spacy

我遇到的所有NER训练实例都是名词，但是否可以使用Spacy NER训练动词和名词组合的实体。例如“搅拌锅”。我是先使用基于名词的NER，然后在此类短语上训练嵌套NER，还是直接在Spacy NER中训练该短语。我猜答案将取决于Spacy NER是否将POS和依赖功能作为其培训的一部分。

浏览 5提问于2018-10-29得票数 0

2回答

如何在spaCy的INCEpTION注解文本NER中转换？(CoNLL-U到json)

spacy、named-entity-recognition

我正在使用来注释命名实体，我想用它来训练一个带有spaCy的模型。INCEpTION中有多个选项(例如CoNLL 2000、CoNLL CoreNLP、CoNLL-U)可用于导出带注释的文本。我已经将文件导出为CoNLL-U，我想将其转换为json，因为训练spaCy的NER模块需要此文件格式。有人问过类似的问题，但答案对我没有帮助()。 spaCy的是： python -m spacy convert [input_file] [output_dir] [--file-type] [--converter] [--n-sents] [--morphology] [--lang] 我的第一个

浏览 6提问于2020-12-03得票数 3

2回答

如何评估经过训练的spaCy 3版模型？

python、named-entity-recognition、spacy-3

我想用下面的代码来评估我的经过训练的spaCy模型，并使用内置记分器函数： def evaluate(ner_model, examples): scorer = Scorer() for input_, annot in examples: text = nlp.make_doc(input_) gold = Example.from_dict(text, annot) pred_value = ner_model(input_) scorer.score(gold) return scorer.scor

浏览 2提问于2021-07-01得票数 3

回答已采纳

1回答

Spacy BILOU格式到spacy json格式

python、spacy、spacy-transformers

我正在尝试升级我的spacy版本到夜间，特别是为了使用spacy transformers 因此我将spacy简单训练数据集转换为如下格式 td = [["Who is Shaka Khan?", {"entities": [(7, 17, "FRIENDS")]}],["I like London.", {"entities": [(7, 13, "LOC")]}],] 以上至 [[{"head": 0, "dep": "", "tag&#

浏览 26提问于2020-11-04得票数 1

回答已采纳

1回答

是否可以在现有的SpaCy模型上减少用于训练的NER模型？

spacy

我已经有了一个现有的spaCy模型，我想在运行时用额外的训练数据来改进它。例如，我的训练模型中的训练dataSet如下所示： text="Anna lives in Munich and works at BMW" entity: name=Anna entity: city=Munich entity: company=BMW 在我的实现中，在开始新的训练之前，我从现有模型中获取ner： nlp = spacy.load(modelPath) ner = nlp.get_pipe('ner') 然后我用新的TrainingData训练我现有

浏览 2提问于2020-07-29得票数 0

1回答

Spacy3.0上的自定义NER - ValueError

python、python-3.x、spacy、spacy-3

我正在尝试训练Spacy3.0来识别新的非目标实体。我完全按照本文中指定的方式执行操作： for text, annot in tqdm(TRAIN_DATA): # data in previous format doc = nlp.make_doc(text) # create doc object from text ents = [] for i in annot["entities"]: start = i[0] end = i[1] label = i[2] spa

浏览 0提问于2021-03-30得票数 1

1回答

预先训练的spacy模型或spacy.blank，对于自定义NER，哪种方法是正确的？

python、nlp、spacy、named-entity-recognition、doccano

我想训练一个spacy自定义NER模型，哪一个是最好的选择？列车数据已准备就绪(doccano) 选项1.使用现有的预先训练的spacy模型，并使用自定义NER?进行更新。选项2.使用带有自定义NER的spacy.blank()创建一个空模型？我只想在文本中标识我的自定义实体，其他类型的实体不是necessary...currently

浏览 26提问于2020-08-25得票数 0

1回答

使用Spacy进行命名实体识别的交叉验证

python-3.x、machine-learning、nlp、spacy

我正在尝试在5000万个样本上训练一个自定义的NER模型。我正在使用20次迭代的进行建模。我想知道我是否应该使用交叉验证来获得更准确的样本准确性。如果是，那么交叉验证步骤应该在哪里进行？如果没有，那么我如何拆分/分发我的训练和测试数据，因为我正在使用注释和6个自定义实体，并且很难跟踪每个训练和测试数据中带注释的标签的百分比，因为它是均匀分布的。这是我用来训练的代码- def train_spacy(data, iterations): TRAIN_DATA = data # create blank Language class nlp = spacy.blank(

浏览 3提问于2019-08-01得票数 1

1回答

如何训练自己的模型并用spacy测试它

nltk、spacy、named-entity-recognition

我正在使用下面的代码来训练一个已经存在的spacy ner模型。然而，我在测试中得不到正确的结果：我错过了什么？ import spacy import random from spacy.gold import GoldParse from spacy.language import EntityRecognizer train_data = [ ('Who is Rocky babu?', [(7, 16, 'PERSON')]), ('I like London and Berlin.', [(7, 13, '

浏览 12提问于2019-03-01得票数 1

1回答

不同word2vec嵌入的空间模型给出了相同的结果

python、spacy、word2vec、named-entity-recognition、word-embedding

我试图通过实现我的预训练向量来提高我的spacy NER模型的性能。我使用不同的文本使用word2vec创建了自己的向量，并将它们保存在.txt文件中。然而，我得到了完全相同的分数，这似乎不对。下面是我为一个带有自定义预训练嵌入的文件执行的步骤： !python -m spacy init vectors en /content/drive/MyDrive/MODELS_W2V/JSTOR_uncleaned_sents_model.txt ./uncl_txt --name JSTOR_unlceaned_sents_model nlp = spacy.load("./uncl_

浏览 17提问于2022-09-01得票数 1

回答已采纳

1回答

如何使用100万个标记句子来提高从头开始实现的ner模型的速度

nlp、spacy、named-entity-recognition

我想使用spacy的NER模型从头开始训练一个使用100万个句子的模型。该模型只有两种类型的实体。这是我正在使用的代码。因为我不能共享数据，所以我创建了一个虚拟数据集。我的主要问题是模型训练时间太长。如果你能强调我代码中的任何错误，或者建议其他方法来加速训练，我将不胜感激。 TRAIN_DATA = [ ('Ich bin in Bremen', {'entities': [(11, 17, 'loc')]})] * 1000000 import spacy import random from spacy.util import mi

浏览 13提问于2019-05-04得票数 2

1回答

每次迭代后保存spacy`s模型

python、nlp、spacy、named-entity-recognition

我尝试在每次迭代后保存到Spacy自定义NER模型。我们是否有类似于tensorflow中的API来在每/确定否之后保存模型权重。迭代次数。然后我可以重新加载保存的模型，并从那里继续训练。另外，我如何在linux中利用我系统上的所有内核。我发现四个内核中只有两个在使用。他们使用多任务CNN进行NER，我知道在CPU上重新训练需要更多的时间。还有其他加速NER模型训练的方法。 @plac.annotations( model=("Model name. Defaults to blank 'en' model.", "option", &

浏览 14提问于2018-01-19得票数 1

3回答

Spacy NER模型中的评估

python、spacy

我正在尝试评估使用创建的训练有素的NER模型。通常，对于这些类型的问题，您可以使用f1分数(查准率和召回率之间的比率)。我在文档中找不到训练过的NER模型的精度函数。我不确定它是否正确，但我正在尝试使用以下方法(示例)并使用sklearn中的f1_score from sklearn.metrics import f1_score import spacy from spacy.gold import GoldParse nlp = spacy.load("en") #load NER model test_text = "my name is John"

浏览 51提问于2017-06-29得票数 26

回答已采纳

3回答

如何利用Spacy训练新模型并将其集成到原始模型

model、named-entity-recognition、spacy

我正在尝试用我自己的数据训练纳使用Spacy。我的问题是如何将我受过训练的NER集成到原始模型中？这样就可以方便地不断地训练和使用我的应用程序。我没有找到任何样本。我在下面找到了一些类似的例子来训练NER，但似乎所有这些都没有保存经过训练的模型，并将其集成回Spacy中。有些保存在内存中，有些保存在其他文件夹中.那么，如何以适当的方式来满足我的需求呢？谢谢！我用的是spacy 1.7.3

浏览 1提问于2017-04-13得票数 5

1回答

rasa小鸭模块

config、rasa-nlu、duckling

我试着基于rasa_nlu训练我的机器人。下面是我的配置文件，我有问题，因为像“下个月”这样的实体被ner_spacy识别为不是时间数据。我希望这种类型的实体只被小鸭模块识别。谢谢语言："en“项目："nav-os”管道：-名称："nlp_spacy“模型："en”-名称："ner_spacy“-名称："tokenizer_spacy”-名称："intent_entity_featurizer_regex“-名称："intent_featurizer_spacy”-名称："ner_synonyms“-名称："i

浏览 8提问于2018-07-18得票数 0

1回答

使用IOB标签方案为影评数据集自定义Spacy NER

machine-learning、nlp、spacy

我之前已经使用CRF++模型来识别电影评论数据集中的NER。然而，我发现spacy在使用和可视化方面非常有效。然而，这里的问题是，我如何在spacy中合并CRF++模型？如果这是不可能的，我如何使用IOB标签训练Spacy NER模型来满足我的需求？

浏览 1提问于2018-05-27得票数 0

1回答

在Spacy的自定义NER训练代码中，这个循环是如何工作的？

python、nlp、spacy

我正在编写一个代码，在Spacy的NER引擎中训练自定义实体。我被困在理解一个在线教程的代码的一小部分。这是一个。下面是代码，我无法理解注释# add labels下的两个for循环。我对蟒蛇很陌生。 import spacy ################### Train Spacy NER.########### def train_spacy(): TRAIN_DATA = convert_dataturks_to_spacy("dataturks_downloaded.json"); nlp = spacy.blank('en')

浏览 1提问于2021-01-07得票数 0

回答已采纳

1回答

如何将简单训练样式的数据转换为spaCy的命令行JSON格式？

spacy

我在spaCy文档的部分中有一种新NER类型的训练数据。 TRAIN_DATA = [ ("Horses are too tall and they pretend to care about your feelings", { 'entities': [(0, 6, 'ANIMAL')] }), ("Do they bite?", { 'entities': [] }), ("horses are too tall and the

浏览 5提问于2018-02-22得票数 7

回答已采纳

1回答

使用自定义输入训练spacy模型

python-3.x、spacy

这是我第一次尝试spacy。我有一个spacy训练数据，它的形式如下。 [ { "id":0, "paragraphs":[ { "sentences":[ { "tokens":[ { "orth":"Michael", "tag":"-", "

浏览 17提问于2019-09-12得票数 0

1回答

有没有办法在google上训练spacy？

google-colaboratory、spacy

我想在自定义的数据集上训练spacy模型，但是它需要太多的时间来训练，有什么方法可以加快训练的速度吗？我在ner.begin_training()中传递了ner.begin_training，但它所花费的时间与以前相同。

浏览 4提问于2019-07-11得票数 4

1回答

错误加载已训练的ner空间模型

python、spacy

我正在尝试加载一个经过训练的NER模型，该模型直到今天才正常加载，但是我得到了以下错误，要么导入经过训练的模型，要么导入pt_core_news_lg： nlp4 = spacy.load('/content/gdrive/My Drive/spacy_NER4') ValueError:无法创建维数为0的向量表。如果使用预先训练过的向量，是否加载了这些向量？我在Google Colab上，跟踪这些装置： !pip install spacy==2.3.4 !python -m spacy download pt_core_news_lg 当我导入我的模型时，它会产生这个错误

浏览 2提问于2022-03-25得票数 0

1回答

spaCy 2.0:保存并加载自定义NER模型

python、nlp、spacy

我已经使用自定义标记器在spaCy中训练了一个自定义NER模型。我想不使用记号赋予器来保存NER模型。我使用在spaCy支持论坛中找到的代码尝试了以下代码： import spacy nlp = spacy.load("en") nlp.tokenizer = some_custom_tokenizer # Train the NER model... nlp.tokenizer = None nlp.to_disk('/tmp/my_model', disable=['tokenizer']) 当我尝试加载它时，管道是空的，令人惊讶的是，它有

浏览 6提问于2018-01-30得票数 9

2回答

我们可以训练Spacy进行文本摘要吗

nlp、spacy、spacy-3

Spacy可以训练NER，文本分类。我们可以使用它的功能进行摘要，所以我们可以训练spacy来提高摘要的准确性吗？

浏览 67提问于2021-09-22得票数 0

1回答

在spaCy v3中使用基本模型训练自定义NER组件

spacy、named-entity-recognition

在spaCy的新版本中，我在训练基础模型中的自定义NER组件时遇到了问题。到目前为止，我一直在CLI中使用以下命令训练我的NER模型： python -m spacy train en model training validation --base-model en_core_web_sm --pipeline "ner" -R -n 10 根据用例的不同，我采用en_core_web_sm或en_core_web_lg作为基本模型来使用其他组件，如标记器和pos。在spaCy版本3中，需要一个配置文件来处理命令。我正在使用以下配置进行训练： [paths] train

浏览 23提问于2021-02-05得票数 0

1回答

基于现有模型的spaCy v3训练器或在现有模型中添加自定义训练器

python、machine-learning、spacy、named-entity-recognition

在spaCy < 3.0中，我能够在经过训练的en_core_web_sm模型中训练NER组件 python -m spacy train en model training validation --base-model en_core_web_sm --pipeline "ner" -R -n 10 具体来说，我需要标记器和en_core_web_sm模型的解析器。spaCy的新版本不再使用这些命令，它们需要在配置文件中设置。根据spaCy的网站，这些组件可以与相应的源代码一起添加，然后在配置文件的培训部分插入到frozen_component (我将在这个问题的末尾

浏览 0提问于2021-02-07得票数 5

2回答

带有SpaCy的自定义POS标记

nlp、named-entity-recognition、spacy

对NLP来说非常新，尤其是NER。我试图在自定义数据集上训练一个NER模型。这是待售房屋的数据集。作为实体的一部分，我正在训练模型来提取reference数字。它们的长度是可变的(但通常在4-9之间)，看起来像G55L7或LPP01Z1-32。我怎样才能给这些实体一个新的"POS标签“，据我所知，在SpaCy的默认列表中找不到匹配它们的任何东西？理想情况下，我希望将其与已有的NER模型一起进行培训，这样我也可以提取SpaCy已经支持的SpaCy。

浏览 0提问于2019-10-10得票数 0

1回答

训练自定义NER模型

python、machine-learning、nltk、spacy、named-entity-recognition

我一直在一些文本上训练我的NER模型，并试图在其中找到具有自定义实体的城市。示例：- ('paragraph Designated Offices Party A New York Party B Delaware paragraph pricing source calculation Market Value shall generally accepted pricing source reasonably agreed parties paragraph Spot rate Spot Rate specified paragraph reasonably agreed

浏览 1提问于2019-12-03得票数 1

1回答

SpaCy 3- ValueError：[E973]对于NER数据的意外类型

spacy、spacy-3

我在这个问题上压力太久了，似乎找不到解决办法。我想训练一个新的模型来识别动物和物种的名字。我创建了一个模拟训练集来测试它。然而，我总是得到一个ValueError: [E973] Unexpected type for NER data 我曾在StackOverflow上的其他帖子上尝试过其他解决方案，包括：使用spacy.blank('en')Installing spacy-lookups-data而不是重复检查培训集的格式和类型是否正确所有这些都会导致相同的错误。 import os import spacy from spacy.lang.en import Eng

浏览 39提问于2022-02-24得票数 1

1回答

将NER训练数据转换为Spacy训练数据格式

python、nlp、training-data、named-entity-recognition、spacy-3

我正在使用Spacy创建一个印尼NER模型。我正在使用来自https://raw.githubusercontent.com/yohanesgultom/nlp-experiments/master/data/ner/training_data.txt的训练数据使用此标记格式的上述训练数据： Sementara itu Pengamat Pasar Modal <ENAMEX TYPE="PERSON">Dandossi Matram</ENAMEX> mengatakan, 我想将此训练数据转换为Spacy格式，即： [('Sementar

浏览 14提问于2021-05-08得票数 1

1回答

从零开始在CoNLL 2003数据上训练spaCy的NER模型得到了非常奇怪的结果

machine-learning、nlp、training-data、spacy、named-entity-recognition

我正在尝试从零开始使用spaCy来训练NER模型。我想首先在上试用它，因为它被广泛用作NER系统的基线。下面是我运行的命令： spacy convert -c ner train.txt valid.txt test.txt spacyConverted cd spacyConverted python -m spacy train en trained train.txt.json valid.txt.json --no-tagger --no-parser mkdir displacy python -m spacy evaluate trained/model-final test.t

浏览 1提问于2018-07-26得票数 0

1回答

Spacy v2.0.1自定义NER:如何改进现有模型的培训

anaconda、spacy、python-3.x

我第一次用bellow训练的数据实现了自定义NER，它给了我很好的名字和PrdName预测。我提到了暗号。 if __name__ == '__main__': TRAIN_DATA = [ ('My Name is Rajesh', {'entities': [(11, 17, 'Name')]}), ('My Name is Bakul', {'entities': [(11, 16, 'Name')]}),

浏览 0提问于2020-01-02得票数 1

1回答

如何使用Thinc模型创建自定义spaPcy管道组件

nlp、spacy、spacy-3

我想在spaCy中创建一个自定义管道组件，它使用的是经过预处理的Thinc模型。我希望修改Thinc的输出预测，然后将修改后的值传回管道，即有效地修改ner管道组件。我正在考虑通过自定义管道组件来实现这一点，比如： from spacy.language import Language @Language.component("my_ner") def my_ner(doc): class_probabilities = thinc_do_something(data, model, num_samples) class_value = np.a

浏览 2提问于2022-06-22得票数 1

回答已采纳

1回答

差分空间的“-基-模型”和“-向量”参数用于为NER使用自定义嵌入？

python、spacy、fasttext

我训练了快速文本嵌入，并将它们保存为.vec文件。我想用这些来做我的斯宾塞模型。有什么区别吗 python -m spacy train en [new_model] [train_data] [dev_data] --pipeline ner --base-model embeddings.vec 和 python -m spacy train en [new_model] [train_data] [dev_data] --pipeline ner --vectors embeddings.vec？两种方法产生的训练损失、F评分等几乎相同。

浏览 0提问于2020-11-25得票数 0

回答已采纳

1回答

尝试训练spacy NER管道以添加新命名实体时出现意外的ner数据类型

nlp、spacy、named-entity-recognition

我正在尝试向spacy添加一个新的命名实体，但我无法获得用于ner训练的示例对象的良好示例，并且我得到了一个值错误。下面是我的代码： import spacy from spacy.util import minibatch, compounding from pathlib import Path from spacy.training import Example nlp=spacy.load('en_core_web_lg') ner=nlp.get_pipe("ner") TRAIN_DATA=[('ABC is a worldwide or

浏览 13提问于2021-02-25得票数 1

回答已采纳

1回答

使用自定义数据训练Spacy的预定义NER模型，需要考虑复合因子、批次大小和损失值

python、nltk、spacy、named-entity-recognition

我正在尝试训练spacy NER模型，我有大约2600个段落的数据，每个段落的长度从200到800个单词不等。我必须添加两个新的实体标签，产品和规范。如果没有最好的替代方法，这种方法是不是很好呢？如果可以，那么有没有人能给我建议合适的复合因子和批量大小的值，并且在训练时，损失值应该在范围内，有什么想法吗？到目前为止，我得到的损失值在400-5之间。 def main(model=None, new_model_name='product_details_parser', output_dir=Path('/xyz_path/'), n_iter=20): &

浏览 9提问于2019-01-05得票数 2

3回答

将NER SpaCy格式转换为IOB格式

nlp、spacy、named-entity-recognition

我有已经以SpaCy格式标记的数据。例如： ("Who is Shaka Khan?", {"entities": [(7, 17, "PERSON")]}), ("I like London and Berlin.", {"entities": [(7, 13, "LOC"), (18, 24, "LOC")]}) 但我想尝试使用任何其他NER模型来训练它，例如BERT-NER，它需要IOB标签。有没有SpaCy数据格式到IOB的转换代码？谢谢!

浏览 0提问于2020-01-14得票数 4

1回答

将自定义数据转换为spacy ner格式

spacy

我正在使用flair训练一个自定义的NER模型，但我也想尝试spacy，但我的数据当前采用这种格式 No O 1320160208478 B-NUM P O R O Name O Ryan B-PER Dsouza B-PER 关于如何将其格式化为spacy NER格式，有什么建议吗？提前谢谢。

浏览 42提问于2019-08-19得票数 0

回答已采纳

1回答

我可以使用写字板或文本文档中的注释在spaCy中训练NER吗

python、machine-learning、nlp、spacy、named-entity-recognition

我是否可以使用写字板或文本文档中的注释来训练NER在spaCy中，因为使用句子或段落训练不符合我的要求。谢谢。

浏览 2提问于2018-03-06得票数 0

1回答

用Spacy NER模型的反例来改进训练

python、spacy

我已经为spacy的ner模型提供了一组GoldParse对象进行训练。我现在想做的是评估它在新句子上的结果，并将每个识别的实体标记为“好”或“坏”，然后将这些信息纳入新的一批训练中。这个是可能的吗？ner模型如何从负样本中学习？

浏览 6提问于2018-03-06得票数 3

回答已采纳

1回答

使用Spacy的训练NER模型只使用一个核心

multiprocessing、spacy

当我使用Spacy训练一个NER模型并监控我的CPU时，我可以看到它只使用了一个内核。我在Spacy文档中只找到了一个多处理的示例，但它不适用于训练：https://github.com/explosion/spaCy/blob/master/examples/pipeline/multi_processing.py我只是使用示例中提供的训练代码，但是在TRAINING_DATA中有一个500000元组的列表，该列表遵循相同的结构：("rawtext"，{"entities"：(entity_start_offset，entity_end_offset，&#

浏览 9提问于2019-06-14得票数 0

1回答

spacy中命名实体标签类型的表示法必须与培训数据中带注释的标签类型的符号匹配吗？

spacy、training-data、named-entity-recognition、webanno

我想用spaCy在我自己的语料库上训练NER，它是通过WebAnno注释的.不幸的是，spaCy中的一个NE类别的表示法与WebAnno中的相应表示法不匹配:在WebAnno中，标签是"OTH“，而spaCy标记它是"MISC”(语义上是相同的)。这会否以负面的方式影响训练过程或测试准确性？在这种情况下，是否需要再训练一种NE型的"OTH“？谢谢你的帮助! 使用的spaCy版本: 2.2.5

浏览 1提问于2020-02-11得票数 0

回答已采纳

1回答

SpaCy:在训练自定义实体的模型时，是否需要提前停止？

nlp、spacy、opennlp

我已经将我的数据分为训练和测试两部分。 https://spacy.io/usage/training#ner 根据spacy给出的训练自定义实体的代码片段，似乎没有提前停止。所以我有个问题要问？我是否应该编写一个自定义代码，在每次迭代后执行以下一组事情: 1.迭代完成。2.在测试数据上检验模型的准确性。3.如果精度高于以前的模型，则保存它，否则继续。4.执行下一次迭代。或者我最终的模型在完成所有迭代后，例如30次迭代是最好的模型？？我的自定义代码的示例输出： ? 根据上面的输出，是否可以说最好的模型是在第13次迭代？

浏览 22提问于2019-10-14得票数 1

1回答

有没有什么办法可以将经过eBrevia训练的模型加载到CoreNLP或Spacy中？

nlp、stanford-nlp、spacy、named-entity-recognition、pycorenlp

我有一个来自eBrevia的经过训练的名称实体识别(NER)模型。我想知道是否有一种方法可以使用Python或Java编程将其加载到CoreNLP或Spacy中。编辑:如果预训练的模型是一个pickle模型，有没有办法使用Corenlp或Spacy来加载它？提前感谢！

浏览 12提问于2019-10-03得票数 0

1回答

在spaCy 3.0中使用spaCy优化NER模型

spacy-3

我想将spaCy库中的en_core_web_trf模型用于Named entity recognition。但是，guide for training a自定义模型不包含用于优化预训练模型的信息。如何在spaCy v3.0中对NER模型进行微调？

浏览 53提问于2021-11-13得票数 0

回答已采纳

1回答

Training spaCy - NameError

python、nlp、spacy

我需要训练一个spaCy模型来提高识别产品的准确性。我正在努力训练我的spacy模型。我有以下代码： TRAIN_DATA = [('..., {'entities': [(36,55,'PRODUCT')]})] nlp = spacy.load("en_core_web_lg") ner = nlp.get_pipe("ner") optimizer = nlp.create_optimizer() other_pipes = [pipe for pipe in nlp.pipe_names if pipe !=

浏览 22提问于2021-06-20得票数 0

回答已采纳

1回答

为什么Spacy 3 NER在GPU和CPU上使用不同的管道？

gpu、transformer-model、spacy-3

Spacy 'train‘命令使用命令行选项--gpu 0，允许在使用GPU和不使用GPU之间进行“最后一分钟”的选择--只使用CPU。但是，使用在GPU和CPU之间进行选择会导致(基本)配置上的重大差异。在我的例子中(与NER打交道)，我得到了两个不同的管道： for CPU：= "tok2vec"，"ner"for GPU:管线= "ner" (下面的组件设置非常不同)。由于我的GPU只有6GB的内存，所以我很快就耗尽了GPU内存--不能使用它。但是，当我切换到只使用CPU时，这两个管道之间的培训行为就大不相同了： "to

浏览 3提问于2021-05-03得票数 1