Python: Spacy NER和内存消耗_匿名函数和内存消耗_利用spacy和Matcher提取NER主语+动词的问题 - 腾讯云开发者社区

python、nvidia、spacy

我正在尝试使用BERT a微调Spacy NER模型 #Train the data !python -m spacy train -g 0 config_spacy_bert.cfg --output ./output --paths.train ./train.spacy --paths.dev ./train.spacy 配置文件中的批处理大小为2，我收到错误 RuntimeError: CUDA out of memory. Tried to allocate 18.00 MiB (GPU 0; 1.96 GiB total capacity; 958.13 MiB already

浏览 47提问于2021-10-12得票数 0

1回答

蟒蛇空间的多线程训练

python、multithreading、nlp、spacy

我试图找到一种方法来使用多线程在spacy上训练一个新的模型。它看起来像在我的工作计算机(Ubuntu16.04Python3.5)上默认使用多线程，而不是在我的服务器上使用。知道为什么吗？关于服务器上的spaCy & env的信息 Platform Linux-3.14.32-xxxx-grs-ipv6-64-x86_64-with-Debian-8 Python version 3.4.2 Location /home/nlp/.env/lib/python3.4/site-packages/spacy Mod

浏览 0提问于2018-01-30得票数 2

回答已采纳

1回答

不同word2vec嵌入的空间模型给出了相同的结果

python、spacy、word2vec、named-entity-recognition、word-embedding

我试图通过实现我的预训练向量来提高我的spacy NER模型的性能。我使用不同的文本使用word2vec创建了自己的向量，并将它们保存在.txt文件中。然而，我得到了完全相同的分数，这似乎不对。下面是我为一个带有自定义预训练嵌入的文件执行的步骤： !python -m spacy init vectors en /content/drive/MyDrive/MODELS_W2V/JSTOR_uncleaned_sents_model.txt ./uncl_txt --name JSTOR_unlceaned_sents_model nlp = spacy.load("./uncl_

浏览 17提问于2022-09-01得票数 1

回答已采纳

1回答

在空白和预训练的SpaCy模型上使用nlp.update()时有区别吗？

machine-learning、spacy、training-data、named-entity-recognition、spacy-3

我有一个带注释的数据集(TRAIN_DATA)，我使用它来构建自己的NER模型： nlp = spacy.blank("en") if "ner" not in nlp.pipe_names: nlp.add_pipe("ner", last=True) examples_train = [] for text, annotations in TRAIN_DATA: examples_train.append(Example.from_dict(nlp.make_doc(text) pipe_exceptions = [&

浏览 42提问于2021-08-30得票数 0

1回答

使用SpaCy Displacy可视化自定义NER标签

python、spacy、named-entity-recognition、spacy-3

我是spaCy和Python的新手，我想使用这个库来可视化一个NER。这是我找到的示例： import spacy from spacy import displacy NER = spacy.load("en_core_web_sm") raw_text="The Indian Space Research Organisation or is the national space agency of India, headquartered in Bengaluru. It operates under Department of Space which is

浏览 48提问于2021-07-26得票数 1

回答已采纳

1回答

将代码从Spacy2转换为Spacy3 - nlp.update不工作

nlp、spacy、spacy-3

编辑:谢谢你的评论。我将doc= nlp(文本)更改为doc =nlp.make_doc(文本)。我找到了一个我想复制的密码。它显然是用Spacy2写的： # add NER to the pipeline and the new label ner = nlp.get_pipe("ner") ner.add_label("FOOD") # get the names of the components we want to disable during training pipe_exceptions = ["ner", "trf_

浏览 2提问于2021-02-25得票数 0

2回答

apache beam将spacy模型作为数据流中的侧输入进行广播

python、google-cloud-dataflow、apache-beam、spacy

我正在使用python sdk并尝试广播一个spacy模型(~50MB)。作业将在数据流上运行。我是beam的新手，根据我的理解:我们不能在map函数中加载大对象，并且我们不能在提交作业之前加载它们，因为作业大小是有上限的。下面是在worker上“惰性加载”大对象的解决方法。 ner_model = ( pipeline | "ner_model" >> beam.Create([None]) | beam.Map(lambda x: spacy.load("en_cor

浏览 0提问于2020-09-01得票数 0

1回答

SpaCy:您如何将自定义的NER标签添加到预先培训过的模型中？

python、nlp、spacy、named-entity-recognition

我是SpaCy和NLP的新手。我使用的是SpaCy v3.1和Python3.9.7 64位。 My objective：使用预先培训过的SpaCy模型(en_core_web_sm)，并向现有的NER标签(GPE、PERSON、MONEY等)添加一组自定义标签。这样，模型就可以同时识别默认实体和自定义实体。我看过SpaCy文档，我需要的似乎是一个，特别是一个新管道。但是，在我的工作流程中的哪一点还不清楚我应该添加这个新管道，因为在SpaCy 3中，培训是在CLI中进行的，而且从文档中我甚至不清楚在哪里调用了预培训的模型。您可能拥有的任何教程或指针都会受到高度赞赏。我认为应该这样做，但

浏览 9提问于2021-09-14得票数 7

回答已采纳

2回答

使用Spacy训练NER从简历中提取技能。什么是转换中的U-实体名称

python-3.x、spacy、information-extraction、named-entity-recognition

我正在使用training spacy NER从resume.But error中提取技能信息在NER模型中找不到名为“U-SKILL”的过渡训练数据： [(U“我有2年的Python经验”，{"entities"：(30，35，"SKILL")})] 代码： other_pipes = [pipe for pipe in nlp.pipe_names if pipe != "ner"] with nlp.disable_pipes(*other_pipes): optimizer = nlp.begin_training()

浏览 46提问于2019-04-17得票数 4

1回答

从零开始在CoNLL 2003数据上训练spaCy的NER模型得到了非常奇怪的结果

machine-learning、nlp、training-data、spacy、named-entity-recognition

我正在尝试从零开始使用spaCy来训练NER模型。我想首先在上试用它，因为它被广泛用作NER系统的基线。下面是我运行的命令： spacy convert -c ner train.txt valid.txt test.txt spacyConverted cd spacyConverted python -m spacy train en trained train.txt.json valid.txt.json --no-tagger --no-parser mkdir displacy python -m spacy evaluate trained/model-final test.t

浏览 1提问于2018-07-26得票数 0

1回答

如何用SpaCy从磁盘加载自定义的NER模型？

spacy、spacy-3

我已经用以下步骤定制了NER管道 doc = nlp("I am going to Vallila. I am going to Sörnäinen.") for ent in doc.ents: print(ent.text, ent.label_) LABEL = 'DISTRICT' TRAIN_DATA = [ ( 'We need to deliver it to Vallila', { 'entities': [(25, 32, 'DISTRICT')]

浏览 14提问于2022-05-03得票数 0

回答已采纳

3回答

找不到函数“spacy-Transers.TransformerModel.v3”在函数注册表‘体系结构’中

named-entity-recognition、bert-language-model、spacy-3、spacy-transformers

我试图创建一个自定义的NER模型。我使用spacy库来创建模型。这一行代码是从base.config文件创建配置文件。我的代码是: !python -m spacy init fill-config /content/drive/MyDrive/NER_RE_New/NER/base_config.cfg /content/drive/MyDrive/NER_RE_New/NER/config.cfg 错误： catalogue.RegistryError: [E893] Could not find function 'spacy-transformers.Transfo

浏览 10提问于2021-10-24得票数 1

回答已采纳

2回答

如何在spaCy的INCEpTION注解文本NER中转换？(CoNLL-U到json)

spacy、named-entity-recognition

我正在使用来注释命名实体，我想用它来训练一个带有spaCy的模型。INCEpTION中有多个选项(例如CoNLL 2000、CoNLL CoreNLP、CoNLL-U)可用于导出带注释的文本。我已经将文件导出为CoNLL-U，我想将其转换为json，因为训练spaCy的NER模块需要此文件格式。有人问过类似的问题，但答案对我没有帮助()。 spaCy的是： python -m spacy convert [input_file] [output_dir] [--file-type] [--converter] [--n-sents] [--morphology] [--lang] 我的第一个

浏览 6提问于2020-12-03得票数 3

1回答

如何识别句子的自定义关键字并在新列中分配自定义名称？

python、nlp、spacy、named-entity-recognition

我是NLP NER (命名实体识别)领域的新手(以及一般的编程)，我正在寻找一些关于如何开始/知道如何完成项目的指导。我有一个excel文件，每行大约有5列多个句子(大约15000行)。每一行都有几段文字来自填写调查问卷的人。我想遍历每一行以确定几个特定的单词，如“热”、“冷”、“温热”、“球”、“纸”等。如果在句子中发现这些单词中的任何一个，我希望在它旁边的新列中创建一个新词来表示它-例如，在句子中找到的单词"hot“、"cold”和"temperature“在新列中将被赋予一个新词，如”temperature“；"ball”或"bat“将在新列

浏览 18提问于2021-06-05得票数 0

1回答

Spacy BILOU格式到spacy json格式

python、spacy、spacy-transformers

我正在尝试升级我的spacy版本到夜间，特别是为了使用spacy transformers 因此我将spacy简单训练数据集转换为如下格式 td = [["Who is Shaka Khan?", {"entities": [(7, 17, "FRIENDS")]}],["I like London.", {"entities": [(7, 13, "LOC")]}],] 以上至 [[{"head": 0, "dep": "", "tag&#

浏览 26提问于2020-11-04得票数 1

回答已采纳

1回答

无法使用CLI评估spacy 3.0中的自定义ner

python、spacy、spacy-3

我正在尝试从磁盘加载一个带有自定义管道的自定义预训练模型，作为spacy 3.0中的管道：工厂的代码是这样的： @CustomEng.factory("ner-crf") def create_my_component(nlp, name): crf_extractor = CRFExtractor().from_disk("path-to-model") return CRFEntityExtractor(nlp, crf_extractor=crf_extractor) 然后我将'ner-crf‘添加到我的语言类中，如下所示：

浏览 28提问于2021-04-25得票数 1

回答已采纳

2回答

使用spaCy 3自定义NERs训练抛出ValueError

python、nlp、spacy、named-entity-recognition、spacy-3

我正在尝试使用spacy 3添加自定义NER标签。我为旧版本找到了教程，并对spacy 3进行了调整。下面是我使用的全部代码： import random import spacy from spacy.training import Example LABEL = 'ANIMAL' TRAIN_DATA = [ ("Horses are too tall and they pretend to care about your feelings", {'entities': [(0, 6, LABEL)]}), ("Do

浏览 1提问于2021-02-22得票数 1

回答已采纳

1回答

如何获得用于计算NER模型的指标的混淆矩阵？

spacy

类似于上一个问题How to calculate the overall accuracy of custom trained spacy ner model with confusion matrix? spaCy在写出经过训练的NER模型时，在meta.json文件中提供精确度、召回率和F1分数。此外，在运行求值命令python -m spacy evaluate时也可以使用这些值。但是，是否有可能获得用于计算这些值的TP、FP、FN的计数？此外，是否有可能输出导致假阳性或假阴性的实际文本/标记？

浏览 25提问于2020-04-15得票数 1

1回答

差分空间的“-基-模型”和“-向量”参数用于为NER使用自定义嵌入？

python、spacy、fasttext

我训练了快速文本嵌入，并将它们保存为.vec文件。我想用这些来做我的斯宾塞模型。有什么区别吗 python -m spacy train en [new_model] [train_data] [dev_data] --pipeline ner --base-model embeddings.vec 和 python -m spacy train en [new_model] [train_data] [dev_data] --pipeline ner --vectors embeddings.vec？两种方法产生的训练损失、F评分等几乎相同。

浏览 0提问于2020-11-25得票数 0

回答已采纳

0回答

当SpaCy只支持标记化(pl - polish)时，如何在Rasa NLU中更改语言？

python、json、nlp、rasa-nlu、rasa-core

如何在Rasa NLU项目中使用波兰语？SpaCy在标记化中支持波兰语我的config.json文件如下所示： { "pipeline" : [ "nlp_spacy", "tokenizer_spacy", "ner_crf", "ner_spacy", "intent_featurizer_spacy", "intent_clas

浏览 2提问于2018-07-17得票数 0

1回答

使用Spacy NER训练多词动词和名词实体

spacy

我遇到的所有NER训练实例都是名词，但是否可以使用Spacy NER训练动词和名词组合的实体。例如“搅拌锅”。我是先使用基于名词的NER，然后在此类短语上训练嵌套NER，还是直接在Spacy NER中训练该短语。我猜答案将取决于Spacy NER是否将POS和依赖功能作为其培训的一部分。

浏览 5提问于2018-10-29得票数 0

1回答

如何从头开始为训练模型自定义名称

model、new-operator、spacy

实际上，我使用CLI创建了模型(NER)(快得多)，但我需要为每个模型自定义名称。我怎么能做到这一点？ python -m spacy train ru SPB_data train.json test_new.json -n 99 -p ner python -m spacy package SPB_data/model-final out cd out/SPB_data-1.0.0 python setup.py sdist

浏览 22提问于2020-04-06得票数 0

1回答

无法识别使用python的两个或多个标签

python、machine-learning、spacy

我对spacy和python很陌生，我正在使用python和nltk来训练我自己的spacy模型，这里是我的代码，我在这里训练数据和测试数据，如果我提供与文本数据相同的测试数据，但是我无法识别超过2个标签，而且每次我编译代码时标签识别是不同的和不正确的，我已经参考了spacy网站，但是我无法找到解决方案。请救救我！ from __future__ import unicode_literals, print_function import plac import random from pathlib import Path import spacy # new entity label

浏览 1提问于2018-04-02得票数 2

1回答

Python nlp spacy OSError：[E050]找不到模型'de‘

python、nlp、spacy

我用pip安装了spacy，想要加载spacy。下面是带有空格的python代码： import spacy nlp = spacy.load('de',disable=['parser', 'tagger','ner']) nlp.max_length = 1198623 不幸的是，代码抛出了以下错误： OSError: [E050] Can't find model 'de'. It doesn't seem to be a shortcut link, a Python package o

浏览 22提问于2019-05-26得票数 1

回答已采纳

1回答

无法将iob转换为spaCy二进制格式

python、nlp、spacy、named-entity-recognition

我尝试将IOB (每行token-per- NER)文件(训练/测试)转换为Spacy 3二进制格式。输入格式示例(分隔符\t，无空格，编码为utf-8)： Département B-LOCATION des I-LOCATION Bouches-du-Rhône I-LOCATION . O Port B-INSTALLATION de I-INSTALLATION la I-INSTALLATION Ciotat I-INSTALLATION . O Avant-projet O du O môle B-INSTALLATION Bérouar

浏览 17提问于2021-10-01得票数 1

1回答

使用spaCy构建自定义模型时出错

python-3.x、machine-learning、nlp、cpu、spacy

问题在之后，我尝试添加一个额外的训练数据集，并在本地cpu环境中训练一个模型。但我不会更改base_config.cfg和config.cfg文件的内容。如何修复这些错误来构建模型并对其进行评估？错误我不确定第一个问题是否是一个问题，我也不知道如何填写config.cfg文件。到目前为止，即使在执行以下过程中的代码之后，config.cfg文件仍然是空的。执行列车命令时会显示错误消息。 ℹ Using CPU ✘ Error parsing config overrides paths -> train not a section value t

浏览 4提问于2021-07-23得票数 1

回答已采纳

2回答

在特定的dataframe列上应用名称-实体识别

python、python-3.x、dataframe、nlp、named-entity-recognition

我有以下数据： df = pd.DataFrame({'source': ['Paul', 'Paul'], 'target': ['GOOGLE', 'Ferrari'], 'edge': ['works at', 'drive'] }) df source target edge 0 Paul GOOGLE w

浏览 1提问于2022-07-25得票数 1

回答已采纳

1回答

在Spacy的自定义NER训练代码中，这个循环是如何工作的？

python、nlp、spacy

我正在编写一个代码，在Spacy的NER引擎中训练自定义实体。我被困在理解一个在线教程的代码的一小部分。这是一个。下面是代码，我无法理解注释# add labels下的两个for循环。我对蟒蛇很陌生。 import spacy ################### Train Spacy NER.########### def train_spacy(): TRAIN_DATA = convert_dataturks_to_spacy("dataturks_downloaded.json"); nlp = spacy.blank('en')

浏览 1提问于2021-01-07得票数 0

回答已采纳

1回答

为什么Spacy 3 NER在GPU和CPU上使用不同的管道？

gpu、transformer-model、spacy-3

Spacy 'train‘命令使用命令行选项--gpu 0，允许在使用GPU和不使用GPU之间进行“最后一分钟”的选择--只使用CPU。但是，使用在GPU和CPU之间进行选择会导致(基本)配置上的重大差异。在我的例子中(与NER打交道)，我得到了两个不同的管道： for CPU：= "tok2vec"，"ner"for GPU:管线= "ner" (下面的组件设置非常不同)。由于我的GPU只有6GB的内存，所以我很快就耗尽了GPU内存--不能使用它。但是，当我切换到只使用CPU时，这两个管道之间的培训行为就大不相同了： "to

浏览 3提问于2021-05-03得票数 1

1回答

如何将带有命名实体的CoNNL格式的文本导入到spaCy中，用我的模型推断实体，并将它们写入相同的数据集(使用Python)？

python、json、spacy、named-entity-recognition、conll

我有一个CoNLL NER格式的数据集，它基本上是一个带有两个字段的TSV文件。第一个字段包含来自某些文本的标记-每行一个标记(每个标点符号在这里也被视为一个标记)，第二个字段包含BIO格式的标记的命名实体标记。我想将这个数据集加载到spaCy中，为我的模型中的文本推断新的命名实体标记，并将这些标记写入与新的第三列相同的TSV文件中。我所知道的就是我可以用下面这样的东西来推断命名实体： nlp = spacy.load("some_spacy_ner_model") text = "text from conll dataset" doc = nlp(tex

浏览 20提问于2019-10-09得票数 1

1回答

将自定义语言添加到Spacy 3.0中，并在其中训练管道

python、spacy、spacy-3

到目前为止，我一直在使用Spacy 2.3.1。我创建了自己的自定义类，继承自Language类，并在其中使用Python脚本训练了一个NER管道。但在Spacy 3.0中，引入了一堆方便的CLI命令和配置，以便训练自定义管道，强烈建议使用这些命令来代替Python脚本。以下是nlp对象的配置示例： ... [nlp] lang = "fa" pipeline = ["transformer","ner"] batch_size = 32 disabled = [] before_creation = null after_creation

浏览 11提问于2021-04-11得票数 1

回答已采纳

2回答

如何在NER上为波斯语提供更快的spacy训练

tensorflow、nlp、spacy、named-entity-recognition、farsi

我有一个来自spacy的空白模型，在config file中，我在这个配置中使用小部件：语言=阿拉伯语组件= ner 硬件= CPU 优化为=精度然后在config-file中，我更改了以下内容： [nlp] lang = "ar" 至 [nlp] lang = "fa" 因为没有对GPU (transformer)进行预培训的persian-language。正如您所知，accuracy类型非常慢，我有400,000记录。这是我的config-file [paths] train = null dev = null vectors = nul

浏览 20提问于2022-07-13得票数 3

1回答

Spacy -错误config.file

config、spacy、named-entity-recognition、transformer-model

在使用自定义标签对ner进行培训时，我以完全类似的方式创建了一个.json文件，但使用我自己的数据，如中所述。然后，我尝试使用以下命令将其转换为训练所需的二进制格式(两者都是train/dev)： python -m spacy convert train.json ./ -t spacy 哪个做了，创建了2个文件。启动培训过程时遇到的错误： [E923] It looks like there is no proper sample data to initialize the Model of component 'ner'. To check your input da

浏览 3提问于2022-01-17得票数 0

1回答

如何修复与当前spaCy版本(2.3.2)不兼容的spaCy en_model？

python-3.x、model、spacy、named-entity-recognition

当我运行我的NER模型时，我得到： UserWarning: [W031] Model 'en_model' (0.0.0) requires spaCy v2.2 and is incompatible with the current spaCy version (2.3.2) 请告诉我怎样才能修复它？ Python3.7.9，spaCy 2.3.2，Ubuntu18.04。

浏览 54提问于2020-09-24得票数 0

回答已采纳

1回答

不给出结果或错误的用于训练阿拉伯语spacy NER模型的Python代码

machine-learning、spacy、training-data、named-entity-recognition

这是用来训练NER空间模型的代码。我的数据集是阿拉伯语tweets文件。我用机器学习工具手动标记了dataset中的位置，但是代码没有运行。我使用了这个链接的代码 ############################################ NOTE ######################################################## # # Creates NER training data in Spacy format from JSON downloaded from Dataturks. # #

浏览 1提问于2020-05-13得票数 0

回答已采纳

2回答

为什么我的NLP模型将错误的单词标记为新实体？

python、nlp、spacy

我是NLP的新手。从过去的2/3天开始做这件事。使用spacy实现这一点。我正在尝试通过使用以下代码来“训练一个额外的实体类型”…… """Example of training an additional entity type This script shows how to add a new entity type to an existing pre-trained NER model. To keep the example short and simple, only four sentences are provided as examples. I

浏览 47提问于2019-09-08得票数 0

2回答

spaCy nlp流水线操作顺序

python、nlp、spacy、lemmatization

是否有人按时间顺序列出了由 import spacy nlp = spacy.load('en_core_web_sm') doc = nlp(text) 我可以看到nlp.pipe_names的主要组件 ['tagger', 'parser', 'ner'] 和一个按字母顺序排列的nlp.factories工厂操作列表 {'merge_entities': <function spacy.language.Language.<lambda>>, 'merge_noun_chunk

浏览 1提问于2018-09-28得票数 2

回答已采纳

1回答

SpaCy 3- ValueError：[E973]对于NER数据的意外类型

spacy、spacy-3

我在这个问题上压力太久了，似乎找不到解决办法。我想训练一个新的模型来识别动物和物种的名字。我创建了一个模拟训练集来测试它。然而，我总是得到一个ValueError: [E973] Unexpected type for NER data 我曾在StackOverflow上的其他帖子上尝试过其他解决方案，包括：使用spacy.blank('en')Installing spacy-lookups-data而不是重复检查培训集的格式和类型是否正确所有这些都会导致相同的错误。 import os import spacy from spacy.lang.en import Eng

浏览 39提问于2022-02-24得票数 1

2回答

自定义名称实体重命名

python、python-3.x、nlp、spacy、named-entity-recognition

我有以下一句话： text="The weather is extremely severe in England" 我想执行一个自定义的Name Entity Recognition (NER)过程首先，一个普通的NER过程将输出带有GPE标签的GPE pip install spacy !python -m spacy download en_core_web_lg import spacy nlp = spacy.load('en_core_web_lg') doc = nlp(text) for ent in doc.ents: pri

浏览 21提问于2022-08-08得票数 3

回答已采纳

1回答

在使用spacy的NER模型进行评估时，为什么'las'，'uas‘和'tags_acc’等于0？

metrics、spacy、named-entity-recognition

import spacy from spacy.gold import GoldParse from spacy.scorer import Scorer from spacy.attrs import ENT_IOB, ENT_TYPE from spacy.tokens import Span nlp = spacy.load('en_core_web_sm') def evaluate(ner_model, examples): scorer = Scorer() fo

浏览 0提问于2018-12-09得票数 2

1回答

有没有一种方法可以将Spacy en_core_web_sm应用到数据块中？

python、pandas、performance、out-of-memory、spacy

我有一个包含300.000篇文章的庞大的数据集，我想使用Spacy的en_core_web_sm来做标记化、词性标记、词汇化、句法依赖和NER。然而，我的电脑总是内存不足。有没有一种方法可以改变我的代码来处理块中的数据？这是数据集：https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/ULHLCB 这就是我正在使用的： df_2018 = pd.read_csv("2018_articles.csv") import spacy nlp_spacy_core_web_sm = spa

浏览 12提问于2021-10-30得票数 2

回答已采纳

1回答

将自定义NER添加到Spacy 3管道

python、named-entity-recognition、spacy-3

我正在尝试构建一个基于en_core_web_sm管道的自定义Spacy管道。据我所知，在打印时，在管道名称中显示的ner已被正确添加(请参见下面)。由于某些原因，当模型在文本上测试时，我没有得到任何结果，但是当自定义ner被自己使用时，正确的实体就被提取出来并贴上标签。我使用的是Spacy 3.0.8和en_core_web_sm管道3.0.0。 import spacy crypto_nlp = spacy.load('model-best') nlp = spacy.load('en_core_web_sm') nlp.add_pipe('n

浏览 6提问于2022-05-06得票数 0

回答已采纳

1回答

无法导入名称'combined_rule_sentence_segmenter‘

python、spacy

我已经安装了所有的包。当导入它们时，会收到类似"cannot import name 'combined_rule_sentence_segmenter'“这样的错误。如何正确导入包。 !pip install https://s3-us-west-2.amazonaws.com/ai2-s2-scispacy/releases/v0.2.0/en_core_sci_sm-0.2.0.tar.gz pip install https://s3-us-west-2.amazonaws.com/ai2-s2-scispacy/releases/v0.2.0/en_core

浏览 33提问于2020-08-25得票数 0

回答已采纳

1回答

rasa小鸭模块

config、rasa-nlu、duckling

我试着基于rasa_nlu训练我的机器人。下面是我的配置文件，我有问题，因为像“下个月”这样的实体被ner_spacy识别为不是时间数据。我希望这种类型的实体只被小鸭模块识别。谢谢语言："en“项目："nav-os”管道：-名称："nlp_spacy“模型："en”-名称："ner_spacy“-名称："tokenizer_spacy”-名称："intent_entity_featurizer_regex“-名称："intent_featurizer_spacy”-名称："ner_synonyms“-名称："i

浏览 8提问于2018-07-18得票数 0

1回答

SpaCy 3.0 -只微调NER组件，同时保持完整的休息

python、spacy、named-entity-recognition、spacy-3、spacy-transformers

我有一些培训数据的新的一组新的not标签，目前没有涵盖在SpaCy的默认NER模型。我已经准备了一个training_data.spacy文件--其中只包含带有新标签的带注释的示例。我能够按照列出的从零开始训练一个空白模型--基本上使用GUI工具创建一个basic_config.cfg，然后填充它来创建一个config.cfg。但是，我不知道如何微调现有模型的NER组件，同时保持所有组件的完整。基本上，我想冻结所有其他组成部分在培训期间。我试着做以下几件事： import spacy spacy.require_gpu() nlp = spacy.load('en_core_web

浏览 29提问于2022-03-22得票数 2

1回答

错误加载已训练的ner空间模型

python、spacy

我正在尝试加载一个经过训练的NER模型，该模型直到今天才正常加载，但是我得到了以下错误，要么导入经过训练的模型，要么导入pt_core_news_lg： nlp4 = spacy.load('/content/gdrive/My Drive/spacy_NER4') ValueError:无法创建维数为0的向量表。如果使用预先训练过的向量，是否加载了这些向量？我在Google Colab上，跟踪这些装置： !pip install spacy==2.3.4 !python -m spacy download pt_core_news_lg 当我导入我的模型时，它会产生这个错误

浏览 2提问于2022-03-25得票数 0

2回答

在SpaCy中将CSV输入自定义NER模型

python、machine-learning、spacy

非常新的ML和Python，并感谢对此问题的任何帮助。我使用Prodigy (基于en_core_web_lg)训练了一个NER模型，并将模型保存到我的虚拟环境中：我在Windows 10上使用了CONDA/VSCODE、SpaCy 2.x环境，现在我正在尝试加载一个以逗号分隔的CSV文件，如下所示： nlp = spacy.load("en_core_web_lg", disable=["ner"]) #remove NER of base model print(nlp.pipe_names) #check to see if remo

浏览 6提问于2021-08-12得票数 0

回答已采纳

2回答

Spacy - ValueError:无法读取文件:模型/模型-最佳/精确性.best

python、nlp、spacy

我想在瑞典的UD树银行上训练一个Spacy模型。为此，我遵循了spacy页面上的说明：培训本身运行，很好，但在最后，它试图打开一个文件，由于某种原因，不存在。至少在这个地方没有。 USER@Ubuntu18:~/spacy_models/sv$ python -m spacy train sv models talbanken-json/sv_talbanken-ud-train.json talbanken-json/sv_talbanken-ud-dev.json ⚠ Output directory is not empty This can lead to unintended

浏览 1提问于2020-01-23得票数 0

回答已采纳

2回答

禁用部分nlp管道

python-3.x、nlp、spacy

我在装有python3的windows系统上运行spaCy v2.x。我没有管理员权限，因此我必须将管道调用为： nlp = en_core_web_sm.load() 当我在*nix机器上运行相同的脚本时，我可以像这样加载管道： nlp = spacy.load('en', disable = ['ner', 'tagger', 'parser', 'textcat']) 我所做的就是标记化，所以我不需要整个管道。在windows机器上，如果我像这样加载管道： nlp = en_core_web_sm.load

浏览 55提问于2018-12-20得票数 10

回答已采纳

1回答

在spaCy v3中使用基本模型训练自定义NER组件

spacy、named-entity-recognition

在spaCy的新版本中，我在训练基础模型中的自定义NER组件时遇到了问题。到目前为止，我一直在CLI中使用以下命令训练我的NER模型： python -m spacy train en model training validation --base-model en_core_web_sm --pipeline "ner" -R -n 10 根据用例的不同，我采用en_core_web_sm或en_core_web_lg作为基本模型来使用其他组件，如标记器和pos。在spaCy版本3中，需要一个配置文件来处理命令。我正在使用以下配置进行训练： [paths] train

浏览 23提问于2021-02-05得票数 0