更新已经存在的spacy NER模型

文章/答案/技术大牛

发布

1回答

、、

我想要更新已经存在的空间模型'en_core_web_sm‘，并用额外的数据训练它。我的数据的格式与spacy的文档https://spacy.io/usage/training中提到的格式相同我遵循了文档中提到的使用我的数据更新NER模型<

浏览 17提问于2019-05-27得票数 0

2回答

我想使用命名实体识别(NER)来识别文本中与临床概念一致的单词或短语。我有一本包含诊断描述及其标签代码的字典。前2行的示例： ICD10 ICD10TermA00 Cholera A000 Cholera due to Vibrio cholerae 01, biovar我找到了spacy-lookup：https://github.com/mpuig/spacy-lookup 我不确定我将如何大规

浏览 29提问于2019-06-27得票数 1

1回答

如何访问经过训练的Spacy Thinc模型？

、、

我正在尝试访问spaCy管道使用的经过训练的神经网络模型。我可以从spaCy文档中看到，config.cfg指定了作为管道一部分的模型实例，但我不知道如何从spaCy中访问这个模型实例(数据结构或其位置)。我想访问模型及其权重，这样我就可以在spaCy之外使用神经网络了。我在想，有没有人知道如何访问Thinc的预训练模型？

浏览 4提问于2022-06-18得票数 1

回答已采纳

1回答

在Spacy的en_core_web_sm模型中添加新的命名实体？

、

下面是关于培训新的实体类型的示例：当我将一个现有的模型传递给它(之前运行它一次创建)，并在dir/my_model dir中正确地加载模型时，它也可以正常工作，该模型仍然识别我的新命名实体python.exe train-new-e

浏览 4提问于2020-12-09得票数 1

回答已采纳

2回答

将自定义NER模型添加到spaCy管道

、

我使用Prodi.gy创建了一个自定义的NER模型。一旦我执行了所有的处理和验证，我就将模型保存到磁盘上。我可以使用spacy.load从磁盘实例化模型，它似乎工作得很好。我现在的问题是如何将自定义NER模型添加到spacy管道中？我想要确保我的管道中有标记器、解析器等，外加我的自定义NER模型。似乎我应该从一个现有的模型(en

浏览 53提问于2021-01-16得票数 1

回答已采纳

1回答

预先训练的spacy模型或spacy.blank，对于自定义NER，哪种方法是正确的？

、、、、

我想训练一个spacy自定义NER模型，哪一个是最好的选择？列车数据已准备就绪(doccano) 选项1.使用现有的预先训练的spacy模型，并使用自定义NER?进行更新。选项2.使用带有自定义NER的spacy.blank()创建一个空模型？我只想在文本中标识我的自定义实体，其他类型的实体不是necessary...cur

浏览 26提问于2020-08-25得票数 0

2回答

获取Spacy错误:没有名为“Spacy.Pipeline.Pipes”的模块；“spacy.pipeline”不是包

、、

我正在尝试测试一个在另一台机器上工作的模型，但是当我尝试将它导入到我的笔记本中时，我得到了这个错误: ModuleNotFoundError:没有名为‘Spacy.Pipeline.Pipes’的模块；'spacy.pipeline‘不是一个包我正在导入：import thinc import unidecod

浏览 106提问于2019-11-07得票数 2

回答已采纳

1回答

NLP更新不能与spacy 3更新后的元组一起使用

、、、

这是我训练一个已经存在的模型的代码。由于SpaCy中的更新，我收到了这个错误消息，但是我无法解决这个问题。 test_f1sc

浏览 11提问于2022-01-07得票数 2

回答已采纳

1回答

不同word2vec嵌入的空间模型给出了相同的结果

、、、、

我试图通过实现我的预训练向量来提高我的spacy NER模型的性能。我使用不同的文本使用word2vec创建了自己的向量，并将它们保存在.txt文件中。然而，我得到了完全相同的分数，这似乎不对。下面是我为一个带有自定义预训练嵌入的文件执行的步骤： !/Spacy/eval.spacy --output ner

浏览 17提问于2022-09-01得票数 1

回答已采纳

1回答

如何使用新的培训数据集更新已培训的空间ner模型？

、、

, {'entities': [(21, 26, 'Product')]})第一次训练空白空间模型： TRAIN_DATAif 'ner' not in nlp.pipe_names: nlp.add_pipe(ner, last= &#x

浏览 8提问于2021-12-17得票数 3

回答已采纳

1回答

使用IOB标签方案为影评数据集自定义Spacy NER

、、

我之前已经使用CRF++模型来识别电影评论数据集中的NER。然而，我发现spacy在使用和可视化方面非常有效。然而，这里的问题是，我如何在spacy中合并CRF++模型？如果这是不可能的，我如何使用IOB标签训练Spacy NER模型来满足我的需求？

浏览 1提问于2018-05-27得票数 0

2回答

在分析wiki语料库时禁用Gensim删除标点符号等功能

、、、、

我想用python和gensim在英语维基百科上训练一个word2vec模型。为此，我密切关注。它对我有用，但是我不喜欢结果word2vec模型的地方是命名实体被分割，这使得模型对我的特定应用程序不可用。我需要的模型必须将命名实体表示为一个向量。这就是为什么我计划用spacy解析维基百科文章，并将诸如“北卡罗莱纳州”这样的实体合并到"north_carolina“中，以便word2vec将它们表示为一个向量。到目前一切尚好。

浏览 3提问于2017-04-19得票数 5

1回答

spaCy 2.0:保存并加载自定义NER模型

、、

我已经使用自定义标记器在spaCy中训练了一个自定义NER模型。我想不使用记号赋予器来保存NER模型。我使用在spaCy支持论坛中找到的代码尝试了以下代码：nlp.tokenizer = some_custom_tokenizer# Train the NER model... nlp.tokenizer

浏览 6提问于2018-01-30得票数 9

1回答

SpaCy 3- ValueError：[E973]对于NER数据的意外类型

、

我想训练一个新的模型来识别动物和物种的名字。我创建了一个模拟训练集来测试它。然而，我总是得到一个ValueError: [E973] Unexpected type for NER data使用spacy.blank('en')Installing spacy-lookups-data而不是重复检查培训集的格式和类型是否正确所有这些都会导致相同的<

浏览 39提问于2022-02-24得票数 1

3回答

如何利用Spacy训练新模型并将其集成到原始模型

、、

我正在尝试用我自己的数据训练纳使用Spacy。我的问题是如何将我受过训练的NER集成到原始模型中？这样就可以方便地不断地训练和使用我的应用程序。我没有找到任何样本。我在下面找到了一些类似的例子来训练NER，但似乎所有这些都没有保存经过训练的模型，并将其集成回Spacy中。有些保存在内存中，有些保存在其他文件夹中.那么，如何以适当的方式来满足我<e

浏览 1提问于2017-04-13得票数 5

1回答

如何使用自定义数据集和自定义标记使用spaCy

、、

我有一套关于电影评论的短信。我想用spaCy从它中提取:演员、导演、作者、空气数据等实体。但是，spaCy只使用PERSON的泛型标记。使用我的自定义文本使spaCy找到我的实体ACTOR、director等的代码是什么？

浏览 19提问于2022-12-01得票数 0

1回答

如何使用Spacy* nlp自定义ner同时标识2种类型的文档*

、、、

我想要建立一个SPACY模型，它根据文档类型来识别和使用标记。{"text":{"a":"ABC DEF."text":"ABC"}, {"start":4,"end":6,"doc_type":"b","label":{"text":"SECOND"},"text":&

浏览 3提问于2021-05-27得票数 1

回答已采纳

1回答

Python NER:添加自定义文本和标签以更新NER模型

、、、

我使用ner-d包来构建我的NER模型并清理文本，如下所示： for text in clause_text: doc = ner.name(input_text基本上，我希望能够添加一个带有标签的句子，并更新NER模型，使其更准确/具体到我需要它做的事情。现在我有这样的想法： nlp = spacy.load(

浏览 43提问于2020-07-16得票数 0

1回答

Spacy的空白模型的底层架构是什么。[spacy.blank("en")]

、

要么我错过了他们的文档，要么他们真的很难找到它。任何指向我在哪里可以找到关于底层模型的信息的指针都会很有帮助对于更多的上下文，我将它用于一个带有自定义标签的NER任务，但我认为这并不是很重要。

浏览 26提问于2020-11-07得票数 0

回答已采纳

1回答

使用NLP和ML在Google上自动搜索公司信息(合并和收购)

、、、

如果是，那么我需要知道母公司的名称。我的方法是在谷歌上搜索"Halli labs母公司“。然后我已经抓取了第一页上的所有文本，所有相应的链接，日期等。现在的问题是，公司的名称被标记为"PERSON"，有没有办法解决这个问题？我的方法也足够好吗？因为这基本上是一个人如何发现一家公司是否已经被收购？

浏览 4提问于2018-06-27得票数 0

点击加载更多