Spacy:当实体被不同的名称引用时，计算实体的频率 - 腾讯云开发者社区

named-entity-recognition、spacy

我想把spaCy的NER引擎和一个单独的NER引擎(一个BoW模型)结合起来。我目前正在比较两个引擎的输出，试图找出两者的最佳组合。这两种方法执行得都很得体，但spaCy经常会找到BoW引擎遗漏的实体，反之亦然。我想要的是，每当spaCy找到一个没有被BoW引擎找到的实体时，它就会从它那里访问一个概率分数(或类似的东西)。我能让spaCy为它找到的特定实体打印自己的概率分数吗？比如，“嗨，我是spaCy。我找到了这个标记(或令牌的组合)，X%肯定是一个BLAH类型的实体。”每次spaCy找到一个实体时，我都想知道X这个数字。我想在spaCy的NER引擎内部一定有这样一个数字，加上一个阈值，可能

浏览 5提问于2017-10-25得票数 20

回答已采纳

1回答

如何在dict中保存空格渲染标签

python、nlp、spacy

https://spacy.io/usage/visualizers#ent 我正在尝试使用spaCy来可视化句子中的实体。在上面的链接中，您可以看到一个示例。现在我的问题来了。如何将这些实体保存在字典中？我想分析100个句子，并保存这些实体的频率，看看哪些术语是最常见的。例如: dict = {"PERSON"：23，"ORG"：2，"LOC"：19} 有人能帮帮忙吗？

浏览 15提问于2020-06-19得票数 0

1回答

基于不平衡实体空间V3的命名实体识别

python、deep-learning、nlp、named-entity-recognition、spacy

空间V3模型会受到不平衡实体的影响吗？我已经得到了一个空间格式注释的数据集，如果我查看我的自定义实体，不同实体的配给是不同的。例如，一个实体说'flex‘超过2500，但我也有一个实体说’门‘，也就是21。我训练了我的spacy模型，并使用spacy.evaluate(examples)进行了评估。我的F1分数为0.64，精确度为1.0，召回率为0.47。我想知道这种实体失衡是否影响了模型的性能？如果是，是否有办法解决这个问题？在这方面的任何帮助都将不胜感激。

浏览 0提问于2022-07-15得票数 0

回答已采纳

2回答

nlp.vocab和nlp.vocab.strings有什么区别？

python、nlp、spacy

我正在学习NLP，我想看看我用spacy下载的词汇量。 import spacy nlp = spacy.load('en_core_web_trf') nlp2 = spacy.load('en_core_web_sm') 在导入Spacy并同时加载较大和较小的包后，我检查了以下内容： len(nlp.vocab) 给770， len(nlp2.vocab) 给761， len(nlp.vocab.strings) 给了83934 len(nlp2.vocab.strings) 给了83914。两者有何不同，为何不同？如何检查每个包裹的总词汇量？

浏览 3提问于2021-08-21得票数 1

回答已采纳

1回答

身份文档中的命名实体识别

python、entity、extraction、named-entity-recognition

我正在尝试对驾照等文档中的文本执行命名实体识别(NER)。我们已经从文档中提取了文本。我们的目标是找出哪些文本是名称、地址、国家、文件编号等。用于NER的python库NLTK和Spacy不起作用，因为没有句子来理解上下文。训练NLTK/Spacy是否有效？正则表达式模式匹配在实体提取方面有多好？下面是提取实体的示例。 1)“乔治·华盛顿”--作为名字 2)“华盛顿特区笔大道1600号，20500”--确定为地址下面是一个示例许可证，其中没有标签或部分， ?

浏览 16提问于2019-04-10得票数 0

1回答

Spacy英语语言模型加载时间太长

python、chatbot、spacy、named-entity-recognition

我正在尝试使用python制作一个聊天机器人，为此我使用Spacy进行实体识别，因此我安装了预建Spacy英语语言模型(Medium)来从用户话语中提取实体，但问题是，当我加载模型以从用户话语中提取实体时，需要31秒来加载模型，因为在我的情况下，我正在使聊天机器人的时间变得非常重要。需要你们所有人的一些指导吗，还有其他选择吗？任何帮助都将不胜感激下面是从用户话语中提取实体的代码： import spacy import time def extractEntity(userUtterance): ''' This funtion returns a list

浏览 14提问于2020-05-07得票数 0

回答已采纳

1回答

无法进口专用变压器

spacy-3、spacy-transformers

我已经使用conda install -c conda-forge spacy安装了conda install -c conda-forge spacy，使用了pip install spacy-transformers安装了spacy-transformers。但是当我尝试导入spacy_transformers时。我得到以下错误 --------------------------------------------------------------------------- ModuleNotFoundError Traceback (mos

浏览 14提问于2022-10-27得票数 1

2回答

我们可以训练Spacy进行文本摘要吗

nlp、spacy、spacy-3

Spacy可以训练NER，文本分类。我们可以使用它的功能进行摘要，所以我们可以训练spacy来提高摘要的准确性吗？

浏览 67提问于2021-09-22得票数 0

1回答

英语语言模式在德文文本上超过德语模式？

spacy

英语语言模式在德语敬语实体上的表现是否比德语模型更好？ # pip install spacy # python -m spacy download en # python -m spacy download de nlp = spacy.load('en') # Uncomment line below to get less good results # nlp = spacy.load('de') # Process text text = (u"Das Auto kauft Herr Müller oder Frau Meier, Frank

浏览 0提问于2018-07-25得票数 0

1回答

我想从spacy中的文本中提取文本值。

python、nlp、spacy、information-extraction、named-entity-recognition

我在使用香料方面是新手。我想从句子中提取文本值。 training_sentence="I want to add a text field having name as new data" OR training_sentence=" add a field and label it as advance data" 因此，我想从上面的句子中提取“新数据”和“预发数据”。现在，我能够提取实体，如“添加”，“字段”和“标签”使用自定义纳。但是我无法提取文本值，因为这些值可以是任何内容，而且我也不知道如何在spacy中使用自定义NER来提取文本

浏览 0提问于2019-03-05得票数 3

1回答

训练自定义NER模型

python、machine-learning、nltk、spacy、named-entity-recognition

我一直在一些文本上训练我的NER模型，并试图在其中找到具有自定义实体的城市。示例：- ('paragraph Designated Offices Party A New York Party B Delaware paragraph pricing source calculation Market Value shall generally accepted pricing source reasonably agreed parties paragraph Spot rate Spot Rate specified paragraph reasonably agreed

浏览 1提问于2019-12-03得票数 1

2回答

spaCy nlp -字符串中实体的位置，提取附近的单词

spacy、named-entity-recognition

假设我有一个字符串，想要标记一些实体，比如组织。 string = I was working as a marketing executive for Bank of India, a 4 months.. string_tagged = I was working as a marketing executive for [Bank of India], a 4 months.. 我想要识别标记的实体旁边的单词。如何定位被标记的实体的位置并提取实体旁边的单词？我的代码： import spacy nlp = spacy.load('en') doc = nlp(s

浏览 0提问于2018-05-17得票数 3

1回答

rasa小鸭模块

config、rasa-nlu、duckling

我试着基于rasa_nlu训练我的机器人。下面是我的配置文件，我有问题，因为像“下个月”这样的实体被ner_spacy识别为不是时间数据。我希望这种类型的实体只被小鸭模块识别。谢谢语言："en“项目："nav-os”管道：-名称："nlp_spacy“模型："en”-名称："ner_spacy“-名称："tokenizer_spacy”-名称："intent_entity_featurizer_regex“-名称："intent_featurizer_spacy”-名称："ner_synonyms“-名称："i

浏览 8提问于2018-07-18得票数 0

1回答

RASA实体在训练后没有检测到同义词

rasa-nlu、rasa-core

我试图添加RASA实体的同义词。我已经在培训数据本身定义了同义词。我也在配置文件中定义了ner_synonyms。在接受培训后，如果我提出“累积多少病假”这样的问题，这是对实体的理解，但当我使用sl而不是病假(“最多可以累积多少sl”)时，它并不是标识实体。 training.json { “rasa_nlu_data”: { “entity_synonyms”: [{ “value”: “loss of pay”, “synonyms”: [ { “value”: “loss of pay”, “synonyms”: [ “lop”, “leave withour pay”,

浏览 0提问于2018-10-26得票数 0

1回答

使用Spacy库的NER在简历解析器上没有给出正确的结果

python、nlp、spacy、named-entity-recognition

我正在使用SpaCY的命名实体识别功能从简历中提取姓名、组织等信息。这是我的python代码。 import spacy import PyPDF2 mypdf = open('C:\\Users\\akjain\\Downloads\\Resume\\Al Mal Capital_Nader El Boustany_BD Manager.pdf', mode='rb') pdf_document = PyPDF2.PdfFileReader(mypdf) first_page = pdf_document.getPage(0) nlp = spacy.loa

浏览 25提问于2020-01-27得票数 1

回答已采纳

1回答

用spaCy添加多个spaCy (ValueError：'entity_ruler‘已经存在于管道中)

python、spacy

下面的演示如何添加实体跨越多个令牌的自定义实体规则。这样做的代码如下： import spacy from spacy.pipeline import EntityRuler nlp = spacy.load('en_core_web_sm', parse=True, tag=True, entity=True) animal = ["cat", "dog", "artic fox"] ruler = EntityRuler(nlp) for a in animal: ruler.add_patterns([{"

浏览 0提问于2019-08-17得票数 6

回答已采纳

1回答

在现有空间模型的基础上

nlp、spacy-3

这是一个关于SPACY3.x培训模式的问题。我在StackOverflow上找不到一个很好的答案/解决方案，因此进行了查询。如果我在空间中使用现有的模型，比如en模型，并且想在模型中添加我自己的实体并对其进行训练，那么假设我从事生物医学领域的工作，比如病毒名称、形状、长度、温度、温度值等。我不想丢失被spacy标记的实体，比如组织名称、国家等等。感谢您的所有建议。谢谢

浏览 7提问于2022-08-12得票数 1

1回答

在Spacy的en_core_web_sm模型中添加新的命名实体？

python、spacy

下面是关于培训新的实体类型的示例：当我不把一个现有的模型传递给它，并且正确地创建一个新的模型时，它工作得很好，它可以识别我的新命名实体。 python.exe train-new-entity-type.py 当我将一个现有的模型传递给它(之前运行它一次创建)，并在dir/my_model dir中正确地加载模型时，它也可以正常工作，该模型仍然识别我的新命名实体。 python.exe train-new-entity-type.py -m dir/my_model 但是，我想训练一个新的实体类型，并将它添加到spacy的现有模型中，这样spacy将识别出它自己的以及我的新的实体类型，

浏览 4提问于2020-12-09得票数 1

回答已采纳

2回答

如何从Spacy获得更好的引理

python、nlp、wordnet、spacy、lemmatization

"PM“可以是”pm(时间)“，也可以是”首相“。我想抓住后者。我想让“总理”的引理返回“首相”。我如何使用spacy来完成这个任务？返回意外引理的示例： >>> import spacy >>> #nlp = spacy.load('en') >>> nlp = spacy.load('en_core_web_lg') >>> doc = nlp(u'PM means prime minister') >>> for word in doc:

浏览 1提问于2017-12-04得票数 3

回答已采纳

1回答

如何训练几个NER模型(Spacy)

python、spacy、spacy-3

我正在训练一个名为实体识别的自定义模型，我创建了config.cfg和train.spacy文件，其中包括，我使用它作为预先训练的向量en_core_web_lg [paths] train = null dev = null vectors = "en_core_web_lg" init_tok2vec = null 然后我用以下方法训练模型 !python -m spacy train config.cfg --output ./output --paths.train ./train.spacy --paths.dev ./train.spacy 这是可行的，我可以看到输

浏览 11提问于2022-10-27得票数 0

回答已采纳

1回答

从spacy对象中删除命名实体

python、nlp、spacy、named-entity-recognition

我正在尝试使用Spacy从文档中删除命名实体。我没有发现任何识别命名实体的麻烦。使用以下代码： ne = [(ent.text, ent.label_) for ent in doc.ents] print(ne) persons = [ent.text for ent in doc.ents if ent.label_ == 'PERSON'] print(persons) 输出： 'Timothy D. Cook', 'Peter', 'Peter', 'Benjamin A. Reitzes', &#

浏览 15提问于2020-02-24得票数 0

回答已采纳

1回答

使用BERT的偏移量向spacy文档对象添加实体

python、data-science、spacy、bert-language-model、huggingface-transformers

有没有办法使用BERT的偏移量将实体添加到spacy文档对象？问题是我的整个管道依赖于spacy，并且我使用的是spacy不提供支持的最新PUBMEDBERT。因此，有时pubmedbert给出的实体偏移量不会导致spacy的有效范围，因为标记化是完全不同的。到目前为止，我做了哪些工作来解决我的问题？我做了一个自定义标记器，要求spacy在标点符号上拆分，类似于bert，但在某些情况下，我就是不能制定规则。例如： text = '''assessment Exdtve age-rel mclr degn, left eye, with actv chrdl neo

浏览 14提问于2020-09-17得票数 0

1回答

使用Spacy NER训练多词动词和名词实体

spacy

我遇到的所有NER训练实例都是名词，但是否可以使用Spacy NER训练动词和名词组合的实体。例如“搅拌锅”。我是先使用基于名词的NER，然后在此类短语上训练嵌套NER，还是直接在Spacy NER中训练该短语。我猜答案将取决于Spacy NER是否将POS和依赖功能作为其培训的一部分。

浏览 5提问于2018-10-29得票数 0

1回答

如何获得每个Spacy NER实体的描述？

spacy、named-entity-recognition、spacy-3

我使用从文本中提取一些与我的问题相关的命名实体，例如日期、时间、GPE等等。例如，我需要识别以下句子中的时区： "Australian Central Time" 使用Spacy模型en_core_web_lg，我得到了以下结果： doc = nlp("Australian Central Time") print([(ent.label_, ent.text) for ent in doc.ents]) >> [('NORP', 'Australian')] ，我的问题是：我对实体NORP的确切含义不太清

浏览 2提问于2022-01-24得票数 5

回答已采纳

2回答

数组的概念修改与同步

java、multithreading、arraylist

这个问题更多的是问我做某事的方式是否“正确”。我有一些涉及不断更新图形组件的程序。为此，我有下面的方法。 public void update(){ for (BaseGameEntity movingEntity : movingEntityList) { ((MovingEntity)movingEntity).update(); } } 本质上，包含此方法的类有一个需要更新的所有图形对象的列表，并循环遍历，调用它们各自的更新方法。当我必须添加新实体或从此列表中删除当前实体时，就会出现此问题。实体的添加和删除是由不同的线程处理的，正如您可以猜测的那样，如果

浏览 2提问于2015-09-08得票数 1

回答已采纳

1回答

GAE/standard/second/Python上的Spacy超过最大实例的内存

google-app-engine、spacy、google-app-engine-python

我已经使用GAE有一段时间了，没有任何问题。只是最近的变化是，我增加了Spacy和我训练过的模型。当我使用dev_appserver在本地运行时，应用程序消耗大约153MB。部署后，我得到内存超过错误。即使使用F4_1G实例，我也超出了内存：超过硬内存限制1228 MB和1280 MB后，服务0请求总数。考虑在app.yaml中设置一个更大的实例类。如果我导入Spacy并且不加载我的模型(实例有大约200 my )，那么这个部署就能工作，所以Spacy本身并不是问题所在，但是当我用spacy.load()加载模型时，内存就超过了限制。请注意，在我使用Spacy模型之前就会发生这种

浏览 0提问于2019-03-18得票数 2

回答已采纳

2回答

在spaCy中加入词典(地名录)的理想方法是什么？

python、nlp、named-entity-recognition、spacy

我目前正致力于替换一个基于nltk实体提取的系统，并结合regexp匹配，其中我有几个命名实体字典。字典实体都是常见的类型(人员(雇员)等)。以及定制类型(例如技能)。我想使用预先训练的spaCy模型，并以某种方式包括我的字典，以提高NER的准确性。以下是我对可能的方法的看法：使用spaCy的Matcher API，遍历字典，用回调添加每个短语来添加实体？我刚刚发现了spacy查找，这似乎是提供大量单词/短语来匹配的简单方法。但如果我想要模糊匹配呢？是否有一种方法直接添加到词汇表中，从而通过Bloom过滤器/n克字向量进行一些模糊匹配，或者是否有适合这种需要的扩展？否则，我想

浏览 0提问于2018-02-14得票数 11

1回答

如何使用自定义数据集和自定义标记使用spaCy

spacy、named-entity-recognition、spacy-transformers

我有一套关于电影评论的短信。我想用spaCy从它中提取:演员、导演、作者、空气数据等实体。但是，spaCy只使用PERSON的泛型标记。使用我的自定义文本使spaCy找到我的实体ACTOR、director等的代码是什么？

浏览 19提问于2022-12-01得票数 0

1回答

如何在Spacy中创建具有多模型的NER管道

python、spacy、named-entity-recognition

我正试着训练新的实体为斯佩西纳。我尝试将我的新实体添加到现有的spacy 'en‘模型中。然而，这影响了'en'和我的新实体的预测模型。因此，我建立了一个空白模型并训练了实体识别。这个效果很好。然而，它只能预测我训练过的对象，而不能预测常规的spacy实体识别。比如说我把“马”训练成动物实体。对于给定的文本 txt ='Did you know that George bought those horses for 10000 dollars?' 我期待着下列实体得到认可 George - PERSON horses - ANIMAL 10000

浏览 0提问于2019-02-24得票数 15

3回答

在SpaCy中用其标签替换实体

nlp、spacy、named-entity-recognition

SpaCy是否可以用它的标签替换SpaCy NER检测到的实体？例如：我在玩苹果Macbook的时候正在吃苹果。我用SpaCy训练了NER模型来检测“水果”实体，该模型成功地检测出第一个“苹果”为“水果”，而不是第二个“苹果”。我想对我的数据进行后处理，用它的标签替换每一个实体，所以我想用“水果”代替第一个“苹果”。这句话将是“，我在玩苹果Macbook.时正在吃水果” 如果我简单地使用regex，它将把第二个"Apple“替换为”水果“，这是不正确的。有什么聪明的办法吗？谢谢!

浏览 5提问于2019-11-05得票数 13

回答已采纳

1回答

如何在spaCy中将扩展属性设置为Doc对象，以便从Doc的片(Span)中检索它？

spacy、spacy-3

我希望向跨一个或多个标记的spaCy文档添加一个扩展属性，类似于实体属性，以便在查看包含该属性的span时也可以访问该属性。为了澄清，下面我设置了一个包含跨度到doc.ents的列表。然后，如果我只获取文档的一部分(包含添加的实体)，我仍然可以找到添加的实体。 import spacy nlp = spacy.load("en_core_web_sm") doc = nlp("This is some country. Another sentence") doc.ents = [Span(doc, 2, 4, "GPE")] #doc[2

浏览 11提问于2022-04-03得票数 1

1回答

空间实体规则模式不适用于ent_type

python、nlp、spacy、spacy-3

我试图让实体标尺模式使用引理和ent_type的组合来为短语“land(或land)在巴尔的摩(Location)”生成一个标签。它似乎与Matcher一起工作，但不是我创建的实体统治者。我将覆盖设置为True，所以不太确定为什么不工作。这很可能是一个用户错误，我只是不知道它是什么。下面是代码示例。从输出中可以看到，模式规则是在NER之后添加的，我已经将覆盖设置为true。如有任何意见或建议，将不胜感激！ matcher标记整个短语(在巴尔的摩登陆)，但实体规则没有。码样例 import spacy from spacy.matcher import Matcher nlp = spacy

浏览 8提问于2021-12-22得票数 2

回答已采纳

1回答

用于匹配短语和中间单词的PhraseMatcher

spacy

假设我有以下两句话："Onions are being cut. However, a great big cut to the onions have been observed"，我希望匹配短语“切洋葱”。这只是一个最小的例子。我的要求是，算法遍历所有句子，并返回一个bool，即句子是否包含该短语。另外，我只希望匹配词汇化的版本，在短语之间有0个或更多的单词是可以的。因此，在上面的示例中，我希望它返回[False, True]。我该怎么做呢？我的半个尝试如下(我需要帮助的地方被标记为TODO)： import spacy from spacy.matcher imp

浏览 40提问于2020-04-17得票数 2

回答已采纳

1回答

spaCy只能链接指定的实体吗？

python、spacy、wikipedia、wikidata、entity-linking

这是一篇(据说)有趣的餐馆评论的摘录：我想亲自和Tofu先生握手。虽然我不能从医学上证明这一点，但我100%肯定他们的soondubu含有未定义的属性。从某种程度上说，我在这里用餐后总是感觉更好。吃过冷吗?去他的Nyquil<code>E 210</code>，得到辛辣的<code>e 111/code>和服 soondubu。我想提取重要的实体，并链接到维基百科实体。我对spaCy进行了维基百科/维基数据的小样本培训，并在评论中运行实体链接： [('Tofu', 'PERSON', 'Q177378

浏览 8提问于2020-03-23得票数 0

回答已采纳

2回答

Spacy中的命名实体识别

python、named-entity-recognition、spacy

我正在尝试查找句子的命名实体，如下所示 import spacy.lang.en parser = spacy.lang.en.English() ParsedSentence = parser(u"Alphabet is a new startup in China") for Entity in ParsedSentence.ents: print (Entity.label, Entity.label_, ' '.join(t.orth_ for t in Entity)) 我希望得到的结果是“字母表”，“中国”，但我得到的结果是一个空集。我

浏览 1提问于2018-01-11得票数 12

回答已采纳

1回答

如何在spacy的DependecyMatcher中使用自定义命名enitities数据集？

python、dependencies、spacy、named-entity-recognition、spacy-3

假设我已经从某个文本创建了一个具有所有命名实体(标记为PERSON )的spacy模型或数据集。如果我需要提取对"person“-”根动词“，我如何在DependencyMatcher中应用它？换句话说，我希望DependencyMatcher不要使用它的自定义模型来识别人的名字，而是使用我的(已经制作的)人名数据集。 import spacy from spacy.matcher import DependencyMatcher nlp = spacy.load("en_core_web_lg") def on_match(matcher, doc, id, mat

浏览 9提问于2022-05-22得票数 1

回答已采纳

1回答

在训练模型上使用"Spacy package“：错误"Can't locate model data”

spacy

我正在尝试训练SpaCy中的NER来识别一组新的实体。在我尝试保存并重新加载模型之前，一切都很正常。我正在尝试遵循来自的SpaCy文档建议，所以我一直在使用： model.to_disk("save_this_model") 然后转到命令行并尝试使用以下命令将其转换为包： python -m spacy package save_this_model saved_model_package 这样我就可以使用 spacy.load('saved_model_package') 把模型拉回来。但是，当我试图从命令行使用spacy包时，我一直收到错误消息“Can

浏览 39提问于2018-06-02得票数 0

1回答

如何仅为Spacy的NER实体的特定标签加载数据？

python、nlp、spacy、named-entity-recognition

我刚刚开始探索spaCy，只需要GPE (全球政治实体)的名称实体识别(NER)组件。因此，为了节省加载时间，我只保留“ner”： nlp = spacy.load('en_core_web_sm', disable=['tok2vec','tagger','parser', 'senter', 'attribute_ruler', 'lemmatizer']) 然后，通过运行以下命令创建文本中存在的一组城市/州/国家： doc = nlp(txt) geo_ents =

浏览 8提问于2022-02-25得票数 1

回答已采纳

1回答

spacy-每晚(spacy 2.0)与"thinc.extra.MaxViolation有错误的大小“的问题

python、nlp、spacy

在成功安装了spacy-nightly (spacy-nightly 2.0.0a14)和英语模型(en_core_web_sm)之后，我在尝试运行它时仍然收到了错误消息。 import spacy nlp = spacy.load('en_core_web_sm') ValueError: thinc.extra.search.MaxViolation has the wrong size, try recompiling. Expected 104, got 128 我试图重新安装喷雾和模型，以及它没有帮助。在新的venv中再次尝试过(Python3.6)

浏览 2提问于2017-10-03得票数 3

回答已采纳

1回答

spaCy -按标签对实体进行排序的最有效方法

python、entity、spacy、named-entity-recognition

我使用spaCy管道从文章中提取所有实体。我需要将这些实体保存在一个变量上，这取决于它们被标记的标签。现在我有了这个解决方案，但我认为这不是最合适的解决方案，因为我需要遍历每个标签的所有实体： nlp = spacy.load("es_core_news_md") text = # I upload my text here doc = nlp(text) personEntities = list(set([e.text for e in doc.ents if e.label_ == "PER"])) locationEntities = list(set

浏览 1提问于2019-11-27得票数 3

回答已采纳

1回答

是否可以在现有的SpaCy模型上减少用于训练的NER模型？

spacy

我已经有了一个现有的spaCy模型，我想在运行时用额外的训练数据来改进它。例如，我的训练模型中的训练dataSet如下所示： text="Anna lives in Munich and works at BMW" entity: name=Anna entity: city=Munich entity: company=BMW 在我的实现中，在开始新的训练之前，我从现有模型中获取ner： nlp = spacy.load(modelPath) ner = nlp.get_pipe('ner') 然后我用新的TrainingData训练我现有

浏览 2提问于2020-07-29得票数 0

1回答

如何在RASA NLU中使用印地语模型？

spacy、rasa-nlu、fasttext、rasa-core

我已经建立了我的印地语模型使用FastText与spacy后端。我按照本教程来使用FastText构建我的模型。我还通过以下命令将我的模型与spacy链接起来 python -m spacy link nl_model hi 模型链接成功，您可以查看下图现在我找不到任何关于使用印地语的帮助，比如我需要使用什么样的配置文件，在哪里导入印地语模型，以及现在如何继续？我也有一个问题，像我们的data.json文件看起来像印地语，我们将如何使用实体和意图，实体和意图的名称也应该是印地语或英语？有人可以帮助进一步的处理吗？我被困在这里了。我必须建立一个印地语ChatBot使用RASA堆栈只。

浏览 1提问于2018-10-01得票数 1

2回答

为什么非英语模型不使用spacy转换器模型呢？

spacy、named-entity-recognition、spacy-transformers

为什么像西班牙语(es_dep_news_trf)这样的语言的空间转换器模型没有命名实体识别。然而，对于英语(en_core_web_trf)，它是这样的。代码： import spacy nlp=spacy.load("en_core_web_trf") doc=nlp("my name is John Smith and I work at Apple and I like visiting the Eiffel Tower") print(doc.ents) (John Smith, Apple, the Eiffel Tower)

浏览 7提问于2022-07-18得票数 0

回答已采纳

1回答

使用Spacy的培训数据格式

machine-learning、nlp、artificial-intelligence、spacy

我正在尝试用Spacy构建NLP，但我在格式化培训数据时遇到了问题。我希望我的应用程序能够识别实体和意图。例如，在“我想订购比萨饼”中。其意图是"place_order“，实体将是比萨饼。如何为Spacy中的实体和意图格式化培训数据？

浏览 7提问于2020-06-30得票数 0

回答已采纳

1回答

预先训练的spacy模型或spacy.blank，对于自定义NER，哪种方法是正确的？

python、nlp、spacy、named-entity-recognition、doccano

我想训练一个spacy自定义NER模型，哪一个是最好的选择？列车数据已准备就绪(doccano) 选项1.使用现有的预先训练的spacy模型，并使用自定义NER?进行更新。选项2.使用带有自定义NER的spacy.blank()创建一个空模型？我只想在文本中标识我的自定义实体，其他类型的实体不是necessary...currently

浏览 26提问于2020-08-25得票数 0

1回答

基于频率的空间停止词

python、nlp、spacy、stop-words

我目前正在寻找一个简单的解决方案，以添加自定义停止词到空间。这些停止词应根据单词在整个语料库中的绝对频率来确定。例如，在我的特定领域的文本中，“病人”一词应该被认为是一个停顿词，因为它发生在70%的所有文件中。我的第一个想法是在熊猫申请的帮助下实现这一点，但这需要编写我自己的标记功能。有可能定制Spacy吗？谢谢你的建议

浏览 0提问于2018-03-23得票数 1

回答已采纳

1回答

格式化SpaCy NER的培训数据集

json、format、training-data、named-entity-recognition、spacy

我想用我自己的实体为NER训练一个空白模型。为此，我需要使用dataset，该数据集目前采用.csv格式，并以以下格式提供实体标记(我将为每个相关列提供一个示例行)：栏:句子价值:我想要苹果列:数据价值:想要；@命令；2；6，‘苹果’；@水果；7；13‘ 栏:实体价值:我“命令”水果列: entity_types 值：@bot/@命令；@bot/“食品/”水果为了训练SpaCy的NER，我需要以下形式的json训练数据： TRAIN_DATA = [ ('Who is Shaka Khan?', { 'entiti

浏览 3提问于2017-11-22得票数 6

回答已采纳

1回答

我的NER模型的性能会提高吗？

machine-learning、predictive-modeling、named-entity-recognition、spacy

我从零开始训练一个spacy模型，通过创建我自己的数据集，spacy需要它在其中，模型是一个NER模型，而我试图识别的实体是食物项目。我已经创建了一个有263行的数据集，在此数据集上从头开始训练spacy模型之后，我的模型执行得很好(我获得了大约80%的精度)，而且这个精度看起来可能不太高，但是它更好，我现在能够更好地完成我的任务。现在我想通过增加列车数据来进一步改进我的模型。为了增加列车数据，我正在考虑使用我发送的行作为测试并手动检查spacy是否正确地识别每个实体，以及如果一个句子中的所有实体都被正确识别，那么在我的培训集中使用这个句子。我的问题是，这种方法会在任何方面改进我的模型吗？

浏览 0提问于2019-09-18得票数 0

回答已采纳

2回答

使用spacy从dataframe中提取实体

python、pandas、spacy

我使用pandas读取excel文件中的内容： import pandas as pd df = pd.read_excel("FAM_template_Update 1911274_JS.xlsx" ) df 尝试使用spacy:：提取实体时： import spacy nlp = spacy.load("en_core_web_sm") doc = nlp(df) for enitity in doc.ents: print((entity.text)) Got：：TypeError:参数'string‘的类型不正确(应为str，go

浏览 20提问于2020-02-07得票数 2

1回答

有没有办法在Spacy中定义自定义实体？

python、nlp、spacy

1)我刚刚开始研究NLP，其基本思想是从文本中提取有意义的信息。为此，我使用了"Spacy“。据我所知，Spacy有以下几个实体。组织人物日期钱币红衣主教等等，但我想添加一些自定义实体，如： Nokia-3310应标记为Mobile，XBOX应标记为Games 2)我能在Spacy找到一些受过训练的模特吗？

浏览 0提问于2019-08-16得票数 6

回答已采纳