SpaCy将新行(\n)标记为GPE命名实体

、、

我使用SpaCy来获取命名实体。但是，它总是将新的线条符号错误地标记为命名图元。下面是输入文本。 mytxt = """<?xml version="1.0"?= spacy.load('en_core_web_sm') content = "\n".join([p.get_text() for p in soup.find(&#

浏览 8提问于2019-03-14得票数 1

回答已采纳

1回答

前句对命名实体识别的影响

、、

在命名实体识别(NER)中，前一句对当前句子有什么影响吗？如果你在每个句子中单独应用NER，那么结果是否与在由多个句子组成的文章中使用NER相同？import spacy sentences = "My name is Bruce and I come from New York.'), ('Pete', 'PERSON'

浏览 0提问于2018-11-13得票数 3

回答已采纳

1回答

使用空格识别命名实体-结果不一致

、

我计划使用spacyr R库来跨几篇新闻文章执行命名实体识别(spacyr是spaCy包的R包装器)。我的目标是自动识别网络分析的合作伙伴。然而，spacyr并没有像预期的那样认可共同的实体。(model = "en_core_web_sm") 我希望该公司的“亮标GPE 4 3

浏览 2提问于2022-09-26得票数 0

1回答

请原谅，因为标题可能不太准确Model培训文本： I lived in *Munich last summer. *Germany has a relaxing, slow summer lifestyle. One night, I got food poisoning and couldn't find !Tylenol to make the pain go away, they insisted I take !aspirin instead.

浏览 0提问于2019-07-10得票数 2

1回答

如何在Spacy中创建具有多模型的NER管道

、、

我正试着训练新的实体为斯佩西纳。我尝试将我的新实体添加到现有的spacy 'en‘模型中。然而，这影响了'en'和我的新实体的预测模型。比如说我把“马”训练成动物实体。我期待着下列实体得到认可 George - PERSON

浏览 0提问于2019-02-24得票数 15

1回答

如何将带有命名实体的CoNNL格式的文本导入到spaCy中，用我的模型推断实体，并将它们写入相同的数据集(使用Python)？

、、、、

第一个字段包含来自某些文本的标记-每行一个标记(每个标点符号在这里也被视为一个标记)，第二个字段包含BIO格式的标记的命名实体标记。我想将这个数据集加载到spaCy中，为我的模型中的文本推断新的命名实体标记，并将这些标记写入与新的第三列相同的TSV文件中。我所知道的就是我可以用下面这样的东西来推断命名实体： nlp = spacy.load("some_spacy_ner_model&qu

浏览 20提问于2019-10-09得票数 1

1回答

如何在Spacy语言模型中为空白空间添加标记程序异常

、、、、

下面是我接受用户输入的代码。nlp = en_core_web_sm.load()doc = nlp(text)如果用户以深度学习的形式输入文本，则将文本分解为如何在nlp中添加空白异常？输出如下所示

浏览 0提问于2018-12-12得票数 2

2回答

如何从Spacy获得更好的引理

、、、、

我如何使用spacy来完成这个任务？返回意外引理的示例：>>> #nlp = spacy.load('en')>>> docPM pmprime prime根据doc ，spacy使用WordNet作为引理；引理是词

浏览 1提问于2017-12-04得票数 3

回答已采纳

2回答

如何在spaCy的INCEpTION注解文本NER中转换？(CoNLL-U到json)

、

我正在使用来注释命名实体，我想用它来训练一个带有spaCy的模型。INCEpTION中有多个选项(例如CoNLL 2000、CoNLL CoreNLP、CoNLL-U)可用于导出带注释的文本。spaCy的是：[--n-sents] [-当我使用下面的代码时，我只得到一个没有任何命名实体的输出(参见

浏览 6提问于2020-12-03得票数 3

1回答

NER训练循环中的损失不会减少间隔

、、、

我正在尝试训练一种新的实体类型'HE INST‘--以识别大学。这是唯一的新标签。我有一个很长的文档作为原始文本。我在上面运行了NER，并将实体保存到训练数据中，然后将新的实体标签添加到TRAIN_DATA中(我在有重叠的地方进行了替换)。在所有迭代之后，我有大约18个文本和40个带注释的新entities.Even，模型仍然无法正确预测输出。我没有对脚本做太多修改。Father's ; V.N.=("

浏览 8提问于2019-05-11得票数 4

1回答

如何识别句子的自定义关键字并在新列中分配自定义名称？

、、、

我是NLP NER (命名实体识别)领域的新手(以及一般的编程)，我正在寻找一些关于如何开始/知道如何完成项目的指导。我想遍历每一行以确定几个特定的单词，如“热”、“冷”、“温热”、“球”、“纸”等。此外，如果在每个句子中找到一个以上的单词，则每个新单词将被插入到由逗号分隔的新单元格/列中。因此，如果“热”、“球”和“纸”都在同一句话中，则

浏览 18提问于2021-06-05得票数 0

1回答

Python :改进从dataframe和命名实体中提取二进制文件的方法？

、、、、

我使用Python作为我的NLP库，开发一个包含关于不同汽车的反馈的大数据文件，如下所示：然后，我创建了以下函数，它将Spacy令牌应用于我的dataframe的每一行text + " " + doc[j].

浏览 6提问于2022-04-30得票数 0

回答已采纳

1回答

NER:为Spacy v3定义列车数据

、、、

我从一个词和实体的csv开始，将它们转换为单词和实体的列表，将单词放在句子的列表中，将标记放在每个句子的标签列表中。然后，我将它们转换为json格式。我现在有了多个版本的json文件，我想将它们转换成新的.spacy格式。但是，似乎在使用--转换器ner之后，似乎没有训练数据工作，因为它没有找到NER格式。我首先尝试将示例转换为json文件。请参见⚠，没有发现与选项-n 1一起使用的句子边界。使用-s自动分割句子，或使用-n 0禁用

浏览 2提问于2021-05-03得票数 0

1回答

用spaCy添加多个spaCy (ValueError：'entity_ruler‘已经存在于管道中)

、

下面的演示如何添加实体跨越多个令牌的自定义实体规则。这样做的代码如下：from spacy.pipeline import EntityRuler for ent in doc.ents:我试图按以下方式添加另一个自定义实体标尺

浏览 0提问于2019-08-17得票数 6

回答已采纳

1回答

用Spacy训练新模式

、

我使用Spacy作为命名实体的识别模型，文档为我提供了这段代码来更新现有的模型，这段代码只指定了将用作基础的模型、存储的位置和迭代次数。nlp = spacy.load(model) # load existing spaCy model plac.call(main('en_co

浏览 1提问于2019-07-25得票数 2

回答已采纳

3回答

XDocument文本节点新线

、、、

我试图使用Linq命名空间中的XText将换行符插入文本节点。我有一个字符串，其中包含换行符，但是我需要解决如何将这些字符转换为实体字符(即
)，而不仅仅是让它们以新行的形式出现在XML中。string example = "This is a string\nWith new lines in it\n"; 然后使用一个XElement写出XmlTextWr

浏览 6提问于2011-09-20得票数 4

回答已采纳

3回答