spaCy的(v3.0) `nlp.make_doc(文本)`和``nlp(文本)`之间的区别？为什么要在训练时使用`nlp.make_doc(文本)`？

文章/答案/技术大牛

发布

1回答

python、spacy、named-entity-recognition

根据docs中的示例，我们有 for raw_text, entity_offsets in train_data: example()方法的source code，似乎我们只是对输入文本进行标记，然后对标记进行注释。但是Example对象应该有引用/“黄金标准”和预测值。当我们调用nlp.make_doc()时，文档中的信息是如何结束的此外，当尝试

浏览 38提问于2021-02-08得票数 1

回答已采纳

1回答

如何摆脱“nlp.max_length”的限制？

nlp、spacy、named-entity-recognition、maxlength

我正在尝试使用spacy对文章进行自定义，但是当我开始对模型进行训练时，我会发现这样的错误：“长度为1021312的E088文本超过了最大的1000000.”尝试了以下解决方案:增加nlp.max_length= 1500000 ii.Used spacy "en_core_web_lg“，然后禁用不相关的spacy nlp管道。三、尝试了nlp

浏览 12提问于2022-07-12得票数 1

1回答

spacy 3训练自定义ner模型

python、named-entity-recognition、spacy-3

我试着训练数据集： [(‘文本数据文本数据.’‘，{'entities'：(119,137，'PERSON')})，] n_iter = 8ner = nlp.create_pipe('ner')import Example other_pipes

浏览 70提问于2021-09-07得票数 2

1回答

如何从人工训练的spacy模型进行预测

python、nlp、spacy、named-entity-extraction

我有以下代码来创建和训练一个新的spacy模型。我不知道如何从新文本中预测实体？有人能帮上忙吗？, [(21, 27, "PRODUCT")])] optimizer = nlp.begin_training() random.shuffle(TRAIN_DATA) for

浏览 12提问于2020-06-21得票数 0

回答已采纳

1回答

是否有一种快速的方法可以为spaCy中的每个句子获取标记？

spacy

要将我的句子拆分成记号，我正在做下面的操作，slow是慢的 doc = nlp(text) words = nlpfor w in wo

浏览 0提问于2019-08-27得票数 11

回答已采纳

1回答

空间多标签分类帮助

deep-learning、nlp、multiclass-classification、spacy

我想创建一个使用SpaCy文本多标签的多标签文本分类算法。我不明白以下问题：转换后，我们如何使用它来训练自定义类别和应用不同的模型。

浏览 0提问于2022-03-26得票数 2

回答已采纳

1回答

使用SpaCy* DisplaCy可视化自定义IOB标签*

python、spacy、named-entity-recognition、spacy-3

我有一个文本文件，我已经使用SpaCy创建了一个DOC对象： doc = nlp.make_doc(raw_text) 对于此DOC对象中的每个单词，我还有一个自定义IOP标记列表： ['O', 'B-PERI-DATE', 'I-DATE', 'I-DATE', 'I-DATE', 'O', 'O', 'O', 'O', &#

浏览 95提问于2021-08-12得票数 1

1回答

将代码从Spacy2转换为Spacy3 - nlp.update不工作

nlp、spacy、spacy-3

编辑:谢谢你的评论。我将doc= nlp(文本)更改为doc =nlp.make_doc(文本)。现在，文本和注释在_parser_internals.ner.BiluoPushDown.

浏览 2提问于2021-02-25得票数 0

2回答

在预标记化的文本上使用空格

python、tokenize、spacy

我想使用spacy来处理已经预标记化的文本。将令牌列表解析为spacy不起作用。import spacynlp(["This", "is", "a", "sentence"]) 这给出了一个TypeError(这很有意义)：TypeError: Argument &

浏览 1提问于2019-11-30得票数 1

1回答

使用SpaCy* Displacy可视化自定义NER标签*

python、spacy、named-entity-recognition、spacy-3

我是spaCy和Python的新手，我想使用这个库来可视化一个NER。这是我找到的示例： import spacy displacy.render(text1,style="ent",jupyter=True) The Examp

浏览 48提问于2021-07-26得票数 1

回答已采纳

1回答

在spacy* 3中更新ner模型错误，有什么建议吗？*

python、spacy、spacy-3

这段代码大约在1到2个月前我最后一次使用它的时候就开始工作了。但是现在，发生了一些事情，我不能再运行了。我没有从代码中更改任何东西，只是想再运行一次。losses = {} for batch in spacy.util.minibatch咨询”是一个实体，如下所示： ('et la consultation post-réanimation', {'entities'

浏览 1提问于2021-05-14得票数 0

回答已采纳

3回答

Spacy NER模型中的评估

python、spacy

我正在尝试评估使用创建的训练有素的NER模型。通常，对于这些类型的问题，您可以使用f1分数(查准率和召回率之间的比率)。我在文档中找不到训练过的NER模型的精度函数。我不确定它是否正确，但我正在尝试使用以下方法(示例)并使用sklearn中的f1_score from sklearn.metrics import f1_scor

浏览 51提问于2017-06-29得票数 26

回答已采纳

1回答

如何将对象从主模块传递到另一个模块

python、spacy

，以便在另一个项目中使用它。from spacy.matcher import PhraseMatcher 如何将nlp1对象传递给函数fin

浏览 0提问于2019-09-04得票数 0

1回答

在训练NER时，什么时候应该使用GoldParse？

spacy

在查看使用SpaCy训练NER的示例代码时，我看到有时使用GoldParse，有时不使用。random.shuffle(TRAINING_DATA) doc = nlp.make_docentity_offsets = annotations["entities"] gold =

浏览 7提问于2019-09-21得票数 3

1回答

我正在尝试将存储在列表中的文本与来自json文件的json属性进行匹配。到目前为止，我设法匹配它1:1，这意味着来自json和列表的文本必须完全相同，这是不可取的或有用的.server error 500 something else [dasdasdasdasdas]",] 因此，从该JSON中，我只想将属性message与Failure indicated和Internalserver error 500匹配，

浏览 2提问于2020-09-10得票数 0

回答已采纳

1回答

如何在spaCy上训练伪投影解析器？

spacy、dependency-parsing

我试图按照的示例代码训练一个自定义语义解析器，其思想是得到一个非投射的解析，所以当我传递一个文本时，比如：ROOT AAAA BBBB 12 21 12成为AAAA的子级，21成为BBBB的子级。为了测试这一点，我只训练这个案例，测试同一个案例，但它似乎不起作用，我得到的回应是： [('ROOT', 'ROOT', 'ROOT'), ('AAAA', &#

浏览 10提问于2020-06-02得票数 0

回答已采纳

1回答

有没有一种方法来概括斯派西的retokenizer.split的论点中的食人？

python、split、nlp、spacy

我打算修复只从文本文件中合并的西班牙语单词，并且我正在使用Spacy的retokenizer.split，但是，我想在retokenizer.split中概括orth的参数。Example: words to be splitpatterns = [nlp.make_doc(text) for textfor token in doc]但是

浏览 3提问于2020-10-10得票数 1

1回答

如何使用spacy训练将实体添加到现有的自定义NER模型中？(Spacy* v3.0)*

python、machine-learning、nlp、spacy、named-entity-recognition

我想要使用空间训练(CLI)来接受现有模型(自定义NER模型)，并将用户指定的关键字和实体添加到该模型中。(而不是再次训练整个模型)。我在文件里找不到这个。对spacy v3.0使用spacy列命令。> python -m spacy train config.cfg --output ./train.<em

浏览 5提问于2021-06-22得票数 2

回答已采纳

2回答

命名实体识别的Spacy* 3置信度分数*

python、nlp、named-entity-recognition、spacy-3

我需要获得NER 'de_core_news_lg‘模型预测的标签的置信度分数。在Spacy 2中有一个众所周知的解决方案：doc = nlp('ich möchte mit frau Mustermannin der Musterbank sprechen')doc = nlp.make_doc(

浏览 1提问于2021-03-05得票数 7

1回答

SpaCy textcat_multilabel，如何提供数据

nlp、spacy

正如我被警告过的那样，SpaCy中的文档有点难以阅读。我没有软件工程师/ CS的背景，所以我真的很纠结。我想使用SpaCy的textcat_multilabel (tm)。我已经知道了如何设置配置，以及如何训练数据w/o CLI。我还知道tm希望SpaCy为培训数据(和dev ==验证数据)提供自己的二进制格式。我知道我应该使用DocBin，但我不知道如何做到

浏览 0提问于2023-04-19得票数 2

点击加载更多