如何使用Keras创建NLP处理管道_如何使用Keras创建BERT层？_如何使用子进程管道进行错误处理 - 腾讯云开发者社区

、、

我正在学习NLP，我想看看我用spacy下载的词汇量。 import spacy nlp = spacy.load('en_core_web_trf') nlp2 = spacy.load('en_core_web_sm') 在导入Spacy并同时加载较大和较小的包后，我检查了以下内容： len(nlp.vocab) 给770， len(nlp2.vocab) 给761， len(nlp.vocab.strings) 给了83934 len(nlp2.vocab.strings) 给了83914。两者有何不同，为何不同？如何检查每个包裹的总词汇量？

浏览 3提问于2021-08-21得票数 1

回答已采纳

2回答

空间-保存自定义管道

、、

我正在尝试将一个自定义PhraseMatcher()组件集成到我的nlp管道中，这样我就可以加载自定义Spacy模型，而不必在每次加载时将我的自定义组件重新添加到通用模型中。如何加载包含自定义管道组件的Spacy模型？我创建组件，将其添加到管道中，并使用以下方法保存它： import requests from spacy.lang.en import English from spacy.matcher import PhraseMatcher from spacy.tokens import Doc, Span, Token class RESTCountriesComponent(

浏览 1提问于2018-07-18得票数 10

回答已采纳

1回答

如何将对象从主模块传递到另一个模块

、

以下代码运行时没有错误 import spacy from spacy.matcher import PhraseMatcher nlp = spacy.load('en_core_web_lg') test = nlp(' FWCA rate of pay') phrase_pattern = [r'Rate of Pay'] pattern_name = 'RATES' patterns = [nlp.make_doc(name) for name in phrase_pattern] matcher = PhraseM

浏览 0提问于2019-09-04得票数 0

1回答

如何使用Thinc模型创建自定义spaPcy管道组件

、、

我想在spaCy中创建一个自定义管道组件，它使用的是经过预处理的Thinc模型。我希望修改Thinc的输出预测，然后将修改后的值传回管道，即有效地修改ner管道组件。我正在考虑通过自定义管道组件来实现这一点，比如： from spacy.language import Language @Language.component("my_ner") def my_ner(doc): class_probabilities = thinc_do_something(data, model, num_samples) class_value = np.a

浏览 2提问于2022-06-22得票数 1

回答已采纳

1回答

对现有NLP模型的测试

、、、、

我正在创建一个使用tokenizing的NLP模型 num_words = 5000 tokenizer = Tokenizer(num_words=num_words) tokenizer.fit_on_texts(data) 然后将文本转换为sequences，计算max_tokens以确定输入维度，并对它们执行pad操作： X_train_tokens = tokenizer.texts_to_sequences(X_train) X_test_tokens = tokenizer.texts_to_sequences(X_test) num_tokens = [len(tokens)

浏览 21提问于2020-11-12得票数 0

回答已采纳

1回答

spaCy:如何使用已加载的模型将命名实体写入现有的文档对象？

、、、、

我根据如下文档从自定义令牌列表创建了一个Doc对象： import spacy from spacy.tokens import Doc nlp = spacy.load("my_ner_model") doc = Doc(nlp.vocab, words=["Hello", ",", "world", "!"]) 现在如何使用NER模型将命名实体标签写入doc？我试着做doc = nlp(doc)，但这对我提高TypeError来说不起作用。我不能像往常一样将我的单词列表连接到一个纯文本中来执行doc =

浏览 38提问于2019-10-13得票数 1

回答已采纳

1回答

以模式保存/加载匹配器作为新的管道组件

、、

我是斯皮斯的纽比。现在尝试向Matcher添加许多模式，并将其与管道集成，这样我就可以从管道中加载Matcher组件并使用它，而无需重新添加很多模式。我用下面的代码创建并保存它： pattern = [{"LOWER": "hello"}, {"IS_PUNCT": True}, {"LOWER": "world"}],[{"LOWER": "hello"}, {"LOWER": "world"}] nlp = spacy.load("en_

浏览 1提问于2020-01-09得票数 1

1回答

将SpaCy PhraseMatcher保存到磁盘

我正在用SpaCy创建一个短语匹配器，如下所示： import spacy from spacy.matcher import PhraseMatcher nlp = spacy.load("en") label = "SKILL" print("Creating the matcher...") start = time.time() matcher = PhraseMatcher(nlp.vocab) for i in list_skills: matcher.add(label, None, nlp(i)) 我的list_sk

浏览 18提问于2020-01-06得票数 2

回答已采纳

1回答

为什么没有定义类的图像的预测概率如此之高？

、、、、

我正在尝试创建一个CNN，它可以检测图像中的数字。为此，我开始使用。此数据集附带经过预处理的图像，缩放到32x32 digits.There是10个数字的10个类。我训练了这个网络，它的测试精度接近于0.93。测试精度也是在测试集上计算的，测试集是一组32x32位数。一切都很好。但问题是，预测概率总是一个。下面是其中一个类的输出情况： array([[0.0000000e+00, 0.0000000e+00, 0.0000000e+00, 0.0000000e+00, 1.0000000e+00, 8.5623318e-24, 0.0000000e+00, 0.00000

浏览 0提问于2019-04-20得票数 2

回答已采纳

2回答

我有一个word2vec嵌入-现在呢？

、、、

在我的NLP工作中，我一直依赖Keras嵌入层。但是对于我最近的项目，我想使用一个定制的嵌入层。我已经完成了创建word2vec文件的步骤，但是现在怎么办？有人能提供一个例子，说明在构造模型时我如何用自己的层替换Keras嵌入层吗？

浏览 0提问于2019-06-20得票数 0

1回答

spacy-为什么nlp()适用于单个字符串，而nlp.pipe()适用于字符串列表？

、、

我最近在使用spacy时遇到了一个奇怪的行为，那就是当我处理字符串时，在字符串是单个字符串对象的情况下，我必须使用nlp( string )，而对于由字符串元素组成的列表，我必须使用nlp.pipe(一个列表)。示例如下。 string='this is a string to be process by nlp' doc =['this','is','a','string','list','to','be','processed','

浏览 42提问于2021-03-02得票数 0

回答已采纳

1回答

spacy nlp需要很长时间才能回答(django后端)

、、

我有django后端，我正在使用spacy进行文本处理以下是我的代码示例 nlp = spacy.load('en_core_web_sm') def process_data(jd): # print(jd) print('process_data start', time.time()) #doc = nlp(jd) doc = nlp.pipe([jd]) print('process_data pipe', time.time()) for each in doc: pr

浏览 2提问于2020-10-18得票数 0

4回答

如何在keras中实现Conv1DTranspose？

、

我知道keras中有可以在Image中使用的Conv2DTranspose。我们需要在NLP中使用它，因此需要一维反卷积。我们如何在keras中实现Conv1DTranspose？

浏览 1提问于2017-05-19得票数 29

1回答

将字典项加载到spaCy NLP中

、

我正在努力寻找一种有效的方法来将python字典中的所有条目加载到spaCy NLP中。我的目标是创建一个相似性函数，它可以从dict1中获取一个元素，并从dict2中返回最相似的元素。因为我是同时使用python和spacy的新手，所以我只想到循环遍历dict1中的每一项，然后对dict2的每个元素执行dict1_item = nlp(item)，然后执行dict2_item = nlp(item2)，最后执行similarity(dict1_item[dict2_item]) 我还没有完全实现这种方法，因为大量的循环给了我一个暗示，它将是令人难以置信的缓慢。在数据方面，我比较了大约30

浏览 2提问于2019-04-23得票数 0

2回答

Spacy as_doc()从原始Doc (Benepar)中丢失组件

、、、

我有一根绳子，里面有几个句子。我想得到每个句子的选区解析。为此，我将对完整字符串执行nlp解析，以获得spacy Doc，然后循环遍历doc.sents并使用span.as_doc()将跨文档转换为Docs。但是，当我将跨度转换回Docs时，并不是所有的原始数据都被保留了。具体来说，贝纳帕选区分析已经不复存在。 import spacy import benepar nlp = spacy.load("en_core_sci_md", disable=["ner", "lemmatizer", "textcat"]) nlp.a

浏览 6提问于2022-09-22得票数 1

1回答

吉他指代解析工具

我找到了一个叫吉他的反指代解析工具。我可以发现这个工具解决了他们给出的例子的回指，但是我试着执行脚本，它请求ltchunk脚本，这在网上是找不到的。谁能告诉我如何使用这个工具或任何其他简单的anaphoora解决工具..请..。代码： cat $1 | java -cp gtar1.1.jar uk.ac.essex.malexa.nlp.dp.GuiTAR.txtToXML.StringReplacer "\[\[" "@|" | java -cp gtar1.1.jar uk.ac.essex.malexa.nlp.dp.GuiTAR.txtToXML

浏览 1提问于2011-02-19得票数 1

回答已采纳

1回答

错误解析配置重写- `nlp.tokenizer`节不存在

我在Spacy遇到了一个奇怪的问题，我不知道我是不是做错了什么，还是它是一个真正的bug。我使用Spacy项目并通过以下方法创建默认配置文件： python -m spacy init config spacy.cfg 然后，我尝试使用以下配置加载NLP对象： import spacy config = spacy.util.load_config('./spacy.cfg') nlp = spacy.load("en_core_web_sm", config=config) 执行此操作时，我将得到以下错误： ConfigValidationError:

浏览 6提问于2021-03-02得票数 0

回答已采纳

1回答

如何在spaCy v3中创建自定义ner组件

、

我正在尝试添加一个entityRuler，但是我一直收到这样的错误:E 002无法为法语语言(fr)找到“统治者”的工厂，我不知道如何为V3创建一个自定义组件，我只找到了旧版本的示例，文档让我有点困惑。 pattern = [{"label": "ORG", "pattern": "Neoledge"}] ruler.add_patterns(pattern) nlp.add_pipe('ruler') 编辑： @Language.component('rulerORG') def rul

浏览 0提问于2021-08-03得票数 1

回答已采纳

2回答

亚马逊网络服务SageMaker数据准备

、、、、

我正在尝试理解如何实现机器学习算法，其中预处理和后处理在AWS Sagemaker中是一项繁重的任务。主要思想是从S3获取数据，每次S3中的数据发生变化时，Cloud watch都会触发一个lambda函数来调用SageMaker端点。问题是，一旦训练了算法，在预测新数据之前，我需要对数据进行预处理(自定义NLP预处理)。一旦算法做了预测，我需要接受这个预测，做一个后处理，然后将后处理的数据发送到S3。我的想法是创建一个docker： ├── text_classification/ - ml scripts | ├── app.py

浏览 0提问于2020-06-05得票数 3

1回答

spacy 3训练自定义ner模型

、、

我试着训练数据集： [(‘文本数据文本数据.’，{'entities'：(7，19，'PERSON')，(89，91，'PERSON')，(98,101，'PERSON')})，(‘’文本数据文本数据.‘，{'entities'：(119,137，'PERSON')})，] n_iter = 8 nlp = spacy.blank('en') ner = nlp.create_pipe('ner') for _, annotations in TRAIN_DATA:

浏览 70提问于2021-09-07得票数 2

1回答

AttributeError:模块“transformers”没有特性“”TFBertModel“”

、、

我的env是由pycharm创建的，它有以下包: tensorflow==1.13.0rc1，CUDA = 11和相应的cudn.but从1到269行运行https://github.com/keras-team/keras-io/blob/master/examples/nlp/semantic_similarity_with_bert.py，https://github.com/keras-team/keras-io/blob/master/examples/nlp/semantic_similarity_with_bert.py(f“策略：{策略}”) model.summary()执

浏览 171提问于2021-08-26得票数 0

回答已采纳

1回答

Keras混合模型在每个时期都给出了相同的结果。

、、、、

我创建了一个文本和图像的混合模型。当我训练我的模型时，我在每一个时代都得到同样的结果。下面是我的密码。 import tensorflow as tf import pandas as pd import numpy as np base_dir = "D:/Dataset/xxxx/datasets/xxx/xx/xxxxx/" import os train_dir = os.path.join(base_dir,"trin.jsonl") test_dir = os.path.join(base_dir,"tst.jsonl") de

浏览 3提问于2020-08-19得票数 1

回答已采纳

1回答

一个NLP问题的Keras层组织

、、

我一直在尝试一个NLP问题，我必须预测一些文本的多标签情感。我有8个标签和170 k的训练例子，140 k的测试集。我的最后一本字典的大小大约是190 K。我使用Keras来尝试NN方法，虽然我不确定我的体系结构是否正确，下面是在测试集上给我95 %的模型，我在训练时测试0.7 - 0.3拆分的准确性： model = Sequential model.add(Embedding(max_indexes + 1, 100, weights=[embeddings], input_length=100)) model.add(Bidirectional

浏览 0提问于2018-03-02得票数 4

1回答

SpaCy中的自定义语句边界检测

、、

我正在尝试在spaCy中编写一个自定义句子分段程序，它将整个文档作为一个句子返回。我编写了一个自定义管道组件，它使用来自的代码来完成它。不过，我不能让它起作用，因为它不是改变句子的边界，而是将整个文档作为一个句子来处理，它会抛出两个不同的错误。如果我创建一个空白语言实例，并且只将我的自定义组件添加到管道中，则会得到以下错误： ValueError: Sentence boundary detection requires the dependency parse, which requires a statistical model to be installed and loaded.

浏览 3提问于2018-01-25得票数 3

回答已采纳

1回答

带Spacy管的多线程NLP

、、、、

我正在尝试将Spacy (自然语言处理)样条应用到一个大的文本文件中，比如维基百科转储。下面是基于Spacy的示例的代码： from spacy.en import English input = open("big_file.txt") big_text= input.read() input.close() nlp= English() out = nlp.pipe([unicode(big_text, errors='ignore')], n_threads=-1) doc = out.next() Spacy同时应用所有的nlp操作，如P

浏览 2提问于2016-04-08得票数 6

回答已采纳

1回答

tf.kerasConv2D中的InvalidArgumentError

、、、

我制作了一个卷积网络，在一些层中进行了膨胀，在训练时得到了以下错误：tensorflow.python.framework.errors_impl.InvalidArgumentError: padded_shape[0]=170 is not divisible by block_shape[0]=4 错误发生在名为encoder_5的层上，该层是第一次应用膨胀。当我在该层中使用padding="valid"时，不会出现错误，但这不是一个选项，因为我需要维护尺寸，以便能够在以后的阶段进行连接。我不明白这个错误是从哪里来的，好像填充不能正常工作。错误与这里相同：https:

浏览 42提问于2020-08-14得票数 0

1回答

如何用SpaCy从磁盘加载自定义的NER模型？

、

我已经用以下步骤定制了NER管道 doc = nlp("I am going to Vallila. I am going to Sörnäinen.") for ent in doc.ents: print(ent.text, ent.label_) LABEL = 'DISTRICT' TRAIN_DATA = [ ( 'We need to deliver it to Vallila', { 'entities': [(25, 32, 'DISTRICT')]

浏览 14提问于2022-05-03得票数 0

回答已采纳

1回答

Python:合并多个管道的结果

、

因此，我是Python新手，我一直在从事斯坦福NLP的工作。下面是我创建的两个管道。 nlp = stanza.Pipeline(lang='en', processors='tokenize,mwt,pos,lemma,depparse') doc = nlp('This is Prince Georges medic 829 were en route with a fourteen year old male, gunshot wound. The patient has two wounds both, um, both approximate

浏览 1提问于2020-11-14得票数 2

1回答

如何在Spacy中创建具有多模型的NER管道

、、

我正试着训练新的实体为斯佩西纳。我尝试将我的新实体添加到现有的spacy 'en‘模型中。然而，这影响了'en'和我的新实体的预测模型。因此，我建立了一个空白模型并训练了实体识别。这个效果很好。然而，它只能预测我训练过的对象，而不能预测常规的spacy实体识别。比如说我把“马”训练成动物实体。对于给定的文本 txt ='Did you know that George bought those horses for 10000 dollars?' 我期待着下列实体得到认可 George - PERSON horses - ANIMAL 10000

浏览 0提问于2019-02-24得票数 15

1回答

用spaCy添加多个spaCy (ValueError：'entity_ruler‘已经存在于管道中)

、

下面的演示如何添加实体跨越多个令牌的自定义实体规则。这样做的代码如下： import spacy from spacy.pipeline import EntityRuler nlp = spacy.load('en_core_web_sm', parse=True, tag=True, entity=True) animal = ["cat", "dog", "artic fox"] ruler = EntityRuler(nlp) for a in animal: ruler.add_patterns([{"

浏览 0提问于2019-08-17得票数 6

回答已采纳

1回答

如何用spacy.load("en_core_web_lg")模式取代Spacy英语模式？

、、、、

要更改语言模型中IS_CURRENCY的定义，请使用以下代码。 from spacy.lang.nl import EnglishDefaults, English def is_currency(text): """ Custom function used for detecting currency symbols. :param text: The text that is to be checked. :return: A boolean. """ # Stripping pu

浏览 5提问于2022-03-18得票数 0

1回答

空白模型与预训练模型在空间上的区别

、、

目前，我正试图使用spacy来训练文本分类器，我遇到了以下问题:使用spacy.blank('en')创建空白模型与使用经过预先训练的模型spacy.load('en_core_web_sm')有什么区别。为了了解我编写的代码的不同之处： text = "hello everyone, it's a wonderful day today" nlp1 = spacy.load('en_core_web_sm') for token in nlp1(text): print(token.text, token.le

浏览 2提问于2020-03-27得票数 3

回答已采纳

1回答

需要帮助将Python twitter脚本传输到NLP Bash脚本(Sed、grep等)

、、、、

你好，我对编程非常陌生，我几周前才开始编程。如果我能得到一些帮助，那将是非常感谢的。提前谢谢! 我的python (stream_tweets.py)每分钟从推特上流200-300条推特消息。脚本位于'/home/computer/Twitter/examples/stream_tweets.py‘中我有一个NLP (自然语言处理) bash脚本，分析句子并在bash上打印出来。NLP脚本(corenlp.sh)位于'/home/computer/Standford/corenlp.sh‘中。如果我创建了一个新的bash脚本，如何将这些tweet传输到NLP中？

浏览 1提问于2015-07-22得票数 1

回答已采纳

1回答

spaCy的(v3.0) `nlp.make_doc(文本)`和``nlp(文本)`之间的区别？为什么要在训练时使用`nlp.make_doc(文本)`？

、、

我知道我们应该创建Example对象并将其传递给nlp.update()方法。根据docs中的示例，我们有 for raw_text, entity_offsets in train_data: doc = nlp.make_doc(raw_text) example = Example.from_dict(doc, {"entities": entity_offsets}) nlp.update([example], sgd=optimizer) 看一下make_doc()方法的source code，似乎我们只是对输入文本进行标记，然后对标记进行注

浏览 38提问于2021-02-08得票数 1

回答已采纳

1回答

Spark预培训管道是否只适用于linux系统？

我正在尝试设置一个简单的代码，在其中传递一个数据，并使用johnSnowLabs Spark库提供的经过预先训练的解释管道来测试它。我正在使用anaconda的jupyter笔记本，并使用apache安装了。每次我运行应该加载预先训练的管道的步骤时，它都会抛出一个tensorflow错误。有什么方法可以在本地windows上运行吗？ I was trying this in a maven project earlier and the same error had happened. Another colleague tried it on a linux system and it wo

浏览 0提问于2019-08-22得票数 8

回答已采纳

1回答

Spacy短语添加具有相同匹配id的模式

、

我正在使用spacy的PhraseMatcher来识别用户评论中的药物名称。当应用服务器启动时，我正在从一个大文件中预装名称，但不希望在每个文档进程中都这样做，因为这需要一段时间。在处理新文档时，我希望在短语中添加识别出的新药物，以便它识别新的名称。然而，spacy不会接受同样的match_id的新药。任何帮助都将不胜感激。 # Global preload when application server starts import spacy from spacy.matcher import PhraseMatcher nlp = spacy.blank("en") dr

浏览 2提问于2019-12-17得票数 2

2回答

ImportError:无法从“keras.engine”导入名称“Layer”

、

我在解决这一错误方面面临困难。我想将Layer对象传递给python中的一个类，我面临一个导入错误。这是错误消息。 Traceback (most recent call last): File "/Users/mianafra/Documents/NLP/D2V-BiGRU-CRF/annotate_docs.py", line 3, in <module> from wrap import Sequence File "/Users/mianafra/Documents/NLP/D2V-BiGRU-CRF/wrap.py", li

浏览 11提问于2022-07-20得票数 0

1回答

Tensorflow 2.0将nlp的预处理调色器保存到tensorflow服务器中

、、、

我已经训练了tensforflow 2.0 keras模型来进行一些自然语言处理。我所做的基本上是获取不同新闻的标题，并预测它们属于什么类别。为此，我必须对语句进行标记化，然后添加0来填充数组，使其具有与我定义的长度相同的长度： from tensorflow.keras.preprocessing.text import Tokenizer from tensorflow.keras.preprocessing.sequence import pad_sequences max_words = 1500 tokenizer = Tokenizer(num_words=max_w

浏览 21提问于2020-01-01得票数 1

回答已采纳

1回答

空间中的深度复制PhraseMatcher对象不起作用

、、、

我想要运行一些多处理模块，以运行一些短语匹配的文档并行。为此，我考虑在一个进程中创建短语匹配对象，然后通过创建PhraseMatcher对象的副本在多个进程之间共享。这段代码似乎失败了，没有给出任何错误。为了让事情变得更简单，我尝试过这样做，以展示我正在努力实现的目标。 import copy import spacy from spacy.matcher import PhraseMatcher nlp = spacy.load('en') color_patterns = [nlp(text) for text in ('red', 'green

浏览 1提问于2018-09-21得票数 1

回答已采纳

1回答

填充物在角点做什么？

、、、、

padding参数在keras中的作用是什么？在NLP： tf.keras.preprocessing.sequence.pad_sequences(xtrain, padding='') CNN： model.add(Convolution2D(64,(3,3),padding=''))

浏览 3提问于2022-04-19得票数 -2

回答已采纳

2回答

禁用部分nlp管道

、、

我在装有python3的windows系统上运行spaCy v2.x。我没有管理员权限，因此我必须将管道调用为： nlp = en_core_web_sm.load() 当我在*nix机器上运行相同的脚本时，我可以像这样加载管道： nlp = spacy.load('en', disable = ['ner', 'tagger', 'parser', 'textcat']) 我所做的就是标记化，所以我不需要整个管道。在windows机器上，如果我像这样加载管道： nlp = en_core_web_sm.load

浏览 55提问于2018-12-20得票数 10

回答已采纳

1回答

是否可以在Spacy中对批量标记的文档使用‘管道’？

基于此链接：Is it possible to use spacy with already tokenized input? 我可以让Spacy接受标记化的文档作为输入，并进一步处理文档。代码如下： def nlp_process(self, token_tuple): # token_tuple = ("This is a test", ['This','is','a','test']) doc = Doc(self.nlp.vocab, words=token_tuple[1]) fo

浏览 30提问于2020-06-27得票数 0

回答已采纳

1回答

ontoRootGazetteer的重入方法不起作用

、、

我是NLP的新手。我正在开发一个在GATE NLP上工作的应用程序。因此，我已经创建了一个管道，并且我只在应用程序中通过创建singleton对象加载它一次。因此，由于应用程序的这种性能有所提高，但当我对本体或地名录进行任何更改并重新运行应用程序时，它就不会考虑新添加的单词，因为我通过加载管道使我的对象单独加载，因此它考虑了以前加载的地名录和ontology.So，我使用了以下代码--它使用的是更新的地名录，而不是本体。 application = CorpusControllerSingleton.getInstance(gapFilePath).getApplicationObject

浏览 0提问于2016-11-26得票数 1

回答已采纳

1回答

()函数背后的数学是什么？

、、、、

我正在用NLP和神经网络研究文本分类器背后的数学，我想知道Keras的TOKENIZER函数是如何工作的。是否涉及余弦相似和如何进行字典创建考虑到频率。如果有人知道答案或一本书/文章的反映，我将永远感激。 MAX_NB_WORDS = 50000 MAX_SEQUENCE_LENGTH = 250 tokenizer = Tokenizer(num_words=MAX_NB_WORDS, filters='!"#$%&()*+,-./:;<=>?@[\]^_`{|}~', lower=True) tokenizer.fit_on_texts(data

浏览 0提问于2022-12-07得票数 0

回答已采纳

1回答

InvalidArgumentError: indices[3] = [0,2917]不正常。许多稀疏操作都需要排序索引。

、、、、

我面临以下错误： InvalidArgumentError: indices3 = 0,2917出现故障。许多稀疏操作都需要排序索引。使用tf.sparse.reorder 创建一个正确排序的副本。--我不知道如何修复这个错误。我试着用重新排序的方法，但没有用以下代码如下： def score_transform(X): y_reshaped = np.reshape(X['rating'].values, (-1, 1)) for index, val in enumerate(y_reshaped): if val >= 8:

浏览 6提问于2021-03-16得票数 0

回答已采纳

1回答

仅从corenlp服务器调用openie模块

、、

我只想在coreNLP服务器启动时调用openIE模块。我在shell上尝试了一下： $ java -mx4g -cp "$HOME/corenlp/*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer & $ java -cp "$CORE/*" -Xmx1g edu.stanford.nlp.pipeline.StanfordCoreNLPClient edu.stanford.nlp.naturalli.OpenIE -file inputfile.txt 几秒钟后，日志被冻结，没有任何反应。有人能帮

浏览 1提问于2017-03-07得票数 0

2回答

使用斯坦福CoreNLP进行并发处理(3.5.2)

、、

我在同时注释多个句子时遇到了并发问题。我不清楚是我做错了什么，还是CoreNLP中有个bug。我的目标是使用几个并行运行的线程，使用流水线"tokenize，ssplit，pos，lemma，ner，parse，dcoref“来注释句子。每个线程分配自己的StanfordCoreNLP实例，然后将其用于注释。问题是在某个时刻抛出了一个异常： java.util.ConcurrentModificationException at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:901) at jav

浏览 3提问于2015-06-06得票数 6

3回答

如何在en_trf_bertbaseuncased_lg中使用预训练的变压器模型(“SpaCy”)？

、、

我想知道，我如何能够使用预培训的变压器模型en_trf_bertbaseuncased_lg从spacy为未来的NLP任务(NER，POS等)。文档声明，该模块只能用于以下管道预处理模块()：哨兵 trf_wordpiecer trf_tok2vec 有人能向我解释一下，这些组件正在做什么，在哪些任务中可以使用它们？或者有人知道有什么好的消息来源可以读到？ >>> import spacy >>> nlp = spacy.load("en_trf_bertbaseuncased_lg") >>> nlp

浏览 7提问于2019-12-19得票数 2

回答已采纳

2回答

如何加快Spacy的nlp调用速度？

、、

我要处理数十万条短信。我发现在以下情况中，耗时最长的是： nlp = English() ruler = EntityRuler(nlp) patterns = [...] ruler.add_patterns(patterns) nlp.add_pipe(ruler) ... #This line takes longer than I would like doc = nlp(whole_chat) 诚然，我有很多模式。但是有没有办法加快速度呢？我只有实体标尺管道，没有其他的。

浏览 36提问于2020-05-29得票数 2

1回答

如何创建spaCy文档，因为我有原始文本和‘单词’，但没有‘空格’数据

我想创建spaCy doc，因为我有原始文本和words，但缺少空格数据。 from spacy.tokens import Doc doc = Doc(nlp.vocab, words=words, spaces=spaces) 如何正确操作才不会丢失有关空格的信息？我拥有的数据示例： data= {'text': 'This is just a test sample.', 'words': ['This', 'is', 'just', 'a', 'test',

浏览 1提问于2019-05-07得票数 0