与spaCy上的CoreNLP的OpenIE类似的功能 - 腾讯云开发者社区

、、、

我喜欢spaCy。但是，我想要像CoreNLP的OpenIE那样的功能，在该功能中，我可以获得开箱即用的主语、动词和谓语。我有什么选择？我应该同时使用这两个框架吗？

浏览 38提问于2020-07-12得票数 2

2回答

斯坦福OpenIE示例代码编译错误

、、、

生成编译时错误：不能将SemanticGraphCoreAnnotations.EnhancedDependenciesAnnotation解析为类型我在eclipse 2016下运行eclipse 2016。corenlp-full-2015-12-01.zip、openie.jar、openie-models.jar都包含在我的eclipse项目中。由以下行生成的错误： System.out.println(sentence.get(SemanticGraphCoreAnnotations.EnhancedDependenciesAnnotation.class).toStr

浏览 1提问于2016-08-24得票数 2

1回答

仅从corenlp服务器调用openie模块

、、

我只想在coreNLP服务器启动时调用openIE模块。我在shell上尝试了一下： $ java -mx4g -cp "$HOME/corenlp/*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer & $ java -cp "$CORE/*" -Xmx1g edu.stanford.nlp.pipeline.StanfordCoreNLPClient edu.stanford.nlp.naturalli.OpenIE -file inputfile.txt 几秒钟后，日志被冻结，没有任何反应。有人能帮

浏览 1提问于2017-03-07得票数 0

1回答

斯坦福大学的CoreNLP返回的不仅仅是基本关系三元组。

CoreNLP返回的三元组数比我们预期的要多，即整个句子或短语，而不是构成句子所传达的基本或基本信息的一两个三元组。例如，在句子中： “2011年11月11日16:00 CDT，罗伊·科伊·MD ( Roy )将初步诊断通知汤姆博士。” 我们期望这三倍： preliminary diagnosis; be notify to; Dr. Tom 但我们得到了像这样的三倍： 1.0 diagnosis be notify by Roy Coy MD at 16:00 cdt on 11/11/2011 1.0 diagnosis be notify to Dr. Tom at 16:00

浏览 2提问于2016-11-22得票数 1

1回答

用openIE提取否定词

、

我正试着用斯坦福大学的OpenIE CoreNLP 测试我使用以下基于上可用的演示程序之一的代码 public static void main(String[] args) throws Exception { // Create the Stanford CoreNLP pipeline Properties props = new Properties(); props.setProperty("annotators", "tokenize,ssplit,pos,lemma,depparse,natlog,openie"); props.set

浏览 1提问于2016-10-10得票数 1

回答已采纳

1回答

如何将实体关系从corenlp转换为本体？

、、

我想为新闻数据集创建一个本体。我的任务是将实体关系从corenlp转换为本体。我已经使用Stanford corenlp提取了关系。 for k in range(0,50): text = df['event_summary'][k] print('sentence:'+text+ '\n') output = nlp.annotate(text, properties={"annotators":"tokenize,ssplit,pos,depparse,natlog,openie",

浏览 1提问于2019-08-15得票数 0

1回答

如何在java中使用斯坦福CoreNLP包提取三元组？

、、

我想要一个代码片段，它可以输入一个句子或一组句子，并使用java中的斯坦福CoreNLP包输出或提取三元组(主语、谓语和宾语)。

浏览 6提问于2017-05-30得票数 1

1回答

无法为Stanford的OpenIE注释器实现选项

、、

我已经在Eclipse中成功地运行了斯坦福CoreNLP注释器，但是在实现为OpenIE注释器提供的选项时遇到了问题。最初，我认为这只是openie.filelist选项中的一个错误，并尝试以不同的方式指定文件路径，但后来我注意到其他选项(如openie.format )也不起作用。这是下面包含的代码。 package main.java.com.nlptools.corenlp; import edu.stanford.nlp.ie.util.RelationTriple; import edu.stanford.nlp.ling.CoreAnnotations; import edu.s

浏览 0提问于2018-07-17得票数 1

回答已采纳

1回答

StanfordNLP，CoreNLP，spaCy -不同的依赖关系图

、、、

我试图使用在依赖关系图上定义的简单规则/模式从句子中提取非常基本的信息(例如，主题->谓词->对象等三元组)。我开始使用，因为它很容易设置和使用GPU以获得更好的性能。然而，我注意到，对于一些句子，产生的依赖图看上去并不像我预期的那样--尽管我不是专家。因此，我尝试了另外两种解决方案：和 (我知道它们是由不同的组维护的？) 例如，“汤姆让山姆相信爱丽丝得了癌症。”我已经打印了所有三种方法的依赖项。CoreNLP和spaCy产生了相同的依赖关系，它们与StanfordNLP的依赖关系不同。因此，我倾向于使用CoreNLP和spaCy (另一个优势是，它们会随NER开箱而来)。有没有

浏览 0提问于2019-05-23得票数 0

回答已采纳

1回答

名词中介关系在OpenIE中找不到

、

我在提取名词中介关系时遇到了困难，正如中所概述的那样。当我在当地运行OpenIE时，“美国总统巴拉克·奥巴马( Barack )周一访问了印度”只提取了两种关系： (美国总统巴拉克·奥巴马( Barack Obama )周一前往美国) (美国总统奥巴马前往印度) 没有发现，但：(巴拉克·奥巴马，美国总统) 但是，当我在上运行相同的输入时，第三个关系看起来是要提取的。更有趣的是，如果我从corenlp.run中删除“命名实体”作为注释器，那么第三种关系就不复存在了。所以我想我的问题是什么是正确的配置(版本，模型，注解器.)需要正确提取名词间的关系吗？在我的本地机器上，我下

浏览 0提问于2016-10-07得票数 0

回答已采纳

2回答

斯坦福CoreNLP OpenIE注解器

、

我有一个关于斯坦福大学CoreNLP OpenIE注解器的问题。我正在使用斯坦福大学的stanford-corenlp-full-2015-12-09 CoreNLP版本，以便使用OpenIE提取关系。我不太懂Java，这就是为什么我使用Python3.4的pycorenlp包装器。我想提取一个句子中所有单词之间的关系，下面是我使用的代码。我亦有兴趣展示每一个三胞胎的信心： import nltk from pycorenlp import * import collections nlp=StanfordCoreNLP("http://localhost:9000/")

浏览 2提问于2016-05-22得票数 5

回答已采纳

2回答

利用斯坦福OpenIE进行子句分割

、、

我正在寻找一个很好的工具，可以把复杂的句子分割成分句。由于我使用CoreNLP工具进行解析，所以我了解到OpenIE在从句子中提取关系三元组的过程中处理子句分段。目前，我使用了来自github 的OpenIEDemo类中提供的示例代码，但是它没有正确地将句子分割成子句。以下是代码： // Create the Stanford CoreNLP pipeline Properties props = PropertiesUtils.asProperties( "annotators", "tokenize,ssplit,pos,lemma,parse,na

浏览 2提问于2017-04-07得票数 1

回答已采纳

1回答

斯坦福大学CoreNLP:如何获得只有名字实体(OpenIE)的RelationTriple三元组？

、、

我目前正在CoreNLP开放信息提取(OpenIE)中搜索仅包含主题和对象类型中的NameEntities的关系三元组(Subject、谓词、Object)。但我不知道如何获得RelationTriple对象的实体类型，即List<CoreMap>。下面是来自的代码 import edu.stanford.nlp.ie.util.RelationTriple; import edu.stanford.nlp.ling.CoreAnnotations; import edu.stanford.nlp.pipeline.Annotation; import edu.stanford.

浏览 2提问于2017-08-07得票数 0

1回答

斯坦福OpenIE示例代码不能正常运行

、、

这是我第一次在这里发帖，所以如果我有什么不好的做法，请告诉我。因此，目前我正试图使用斯坦福大学的OpenIE从网络挖掘的数据中提取信息。由于我对Java非常陌生，所以我只是从他们的页面中复制了示例代码片段：看起来是这样的： import java.util.*; import edu.stanford.nlp.pipeline.StanfordCoreNLP; import edu.stanford.nlp.pipeline.Annotation; import edu.stanford.nlp.naturalli.NaturalLogicAnnotations; im

浏览 4提问于2015-09-06得票数 0

1回答

使用自定义NER模型的斯坦福OpenIE

我正在尝试使用斯坦福的OpenIE (版本3.6.0)来提取基于我在化学领域训练过的NER模型的关系三元组。但是，我不能让OpenIE根据我自己的NER模型提取关系三元组。OpenIE似乎只根据包中提供的默认NER模型提取关系三元组。下面是我为训练和部署我的NER模型所做的工作：基于的神经网络模型的训练。在CoreNLP服务器中部署NER模型，然后重新启动服务器。我在props中修改了corenlpserver.sh属性。props属性现在如下所示： props="-Dner.model=$scriptdir/my_own_chemistry.ser.gz,edu/sta

浏览 7提问于2016-12-19得票数 4

1回答

如何训练一个新的OpenIE模型？

我使用stanford-corenlp-4.2.0从非结构化文本中提取数据。OpenIE似乎很有帮助，但应该针对我的特定场景进行改进。有没有可能训练一个新的开放式模型?如何训练？谢谢

浏览 3提问于2021-03-03得票数 0

1回答

斯坦福大学OpenIE与代词共参选项

我试图使用OpenIE选项通过命令行运行resolve_coref模块，但得到了以下错误： [main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator tokenize [main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator ssplit [main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator pos Reading POS tag

浏览 1提问于2016-01-13得票数 0

回答已采纳

1回答

斯坦福大学OpenIE输出不完整

我正在尝试使用CoreNLP测试/运行斯坦福大学的OpenIE程序。下面是我的命令：java -mx1g -cp stanford-corenlp-3.6.0.jar;stanford-corenlp-3.6.0-models.jar;CoreNLP-to-HTML.xsl;slf4j-api.jar;slf4j-simple.jar edu.stanford.nlp.naturalli.OpenIE 我的输入文件包含以下文本： Born in Honolulu, Hawaii, Obama is a US Citizen. Born in a small town, she took

浏览 1提问于2016-06-22得票数 0

1回答

斯坦福大学CoreNLP OpenIE的句子？

我目前正在使用斯坦福大学的OpenIE系统，使用它的Java命令行接口 java -mx32g -cp stanford-corenlp-3.8.0.jar:stanford-corenlp-3.8.0-models.jar:CoreNLP-to-HTML.xsl:slf4j-api.jar:slf4j-simple.jar edu.stanford.nlp.naturalli.OpenIE test_file.txt -threads 8 -resolve_coref true 我的测试文件包含5万句话，每行一句。 OpenIE结果将是所有句子的元组列表。是否有一个旗帜，我可以设置一个对应的

浏览 0提问于2018-01-17得票数 0

回答已采纳

1回答

在Neo4j中持久化空间矢量表示

、、

我将以文本作为属性的节点存储在Neo4j数据库中。然而，当我读取文本并从中创建Spacy对象来计算它们与用户在内存中输入的一个文本之间的相似度时，执行起来花费了太多时间。我想知道解决这个问题的最好方法是什么？我知道斯坦福存在，但它只支持OpenNLP和GraphAware coreNLP。我会想到的另一种方式是将Spacy对象存储为该节点的另一个属性，但当该属性的大小很大时，我不知道性能如何。谢谢！ Bader

浏览 38提问于2020-11-09得票数 1

2回答

可捕获的致命错误:传递给CorenlpAdapter::getOutput()的参数1

、、

我得到以下错误：可捕获的致命错误:传递给CorenlpAdapter::getOutput()的参数1必须是字符串的实例，在第22行的/Library/WebServer/Documents/website/php-stanford-corenlp-adapter/index.php中调用，在第95行的/Library/WebServer/Documents/website/php-stanford-corenlp-adapter/src/CoreNLP/CorenlpAdapter.php中定义 index.php 21和22包含： $text1 = 'I will meet Ma

浏览 1提问于2017-04-12得票数 0

1回答

在下面的斯坦福-nlp OpenIE，你能帮助我吗？

、、

我在网站上做了同样的演示，并说：“哈德逊出生在汉普斯特德，这是伦敦的郊区。” 告诉我以下几点，哈德森是熊我期待着以下的关系： (哈德逊出生于汉普斯特德) (汉普斯特德是伦敦的郊区) import edu.stanford.nlp.ie.util.RelationTriple; import edu.stanford.nlp.ling.CoreAnnotations; import edu.stanford.nlp.pipeline.Annotation; import edu.stanford.nlp.pipeline.StanfordCoreNLP; import edu.s

浏览 0提问于2018-04-13得票数 0

回答已采纳

1回答

为什么'corenlp.run‘在本地运行CoreNLP时产生不同的结果？

、

网站应该是CoreNLP的演示站点，它显示的结果与我在本地机器上运行CoreNLP管道时的结果非常不同。该网站实际上显示了正确的结果，而本地机器版本没有。我想知道是否有任何与CoreNLP项目关系密切的人能够解释这些差异？举个例子--这就是当我用它作为输入“给我在Soquel上的一家提供优质法国菜的餐厅”(这是来自RestQuery数据集)时会发生的情况。在CoreNLP (本地机器，使用斯坦福的默认模型)上，我得到了以下结果： root(ROOT-0, Give-1) iobj(Give-1, me-2) det(restaurant-4, a-3) dobj(Give-1, rest

浏览 3提问于2015-12-31得票数 4

1回答

如何在斯坦福-nlp项目中给出flag选项？

该站点建议我可以使用几个标志但是如何使用它，我试着这样做 import edu.stanford.nlp.ie.util.RelationTriple; import edu.stanford.nlp.ling.CoreAnnotations; import edu.stanford.nlp.pipeline.Annotation; import edu.stanford.nlp.pipeline.StanfordCoreNLP; import edu.stanford.nlp.naturalli.NaturalLogicAnnotations; import edu.stanford.nl

浏览 1提问于2017-11-04得票数 0

1回答

无法调用其他文件夹中的模块

、、

我克隆了，并尝试运行python scripts/pipeline/interactive.py来启动一个程序，就像自述的那样。然而，我总是有以下问题，ModuleNotFoundError。实际上，我用python调用的文件会调用另一个不在同一目录中的文件。以下是完整的错误： . ├── drqa │ ├── pipeline │ │ └── __pycache__ │ ... ... ├── scripts │ ├── convert │ ├── distant │ ├── pipeline │ ├── reader │ └── retriever 下

浏览 0提问于2018-07-18得票数 0

回答已采纳

1回答

自然逻辑推理

、

我一直试图使用与斯坦福大学CoreNLP 3.5.2打包的自然逻辑推理组件(Naturalli)来提取关系triples...however，在创建一个新的OpenIE实例时，我得到了以下例外： Could not load affinity model at edu/stanford/nlp/naturalli/: Could not find a part of the path '...\edu\stanford\nlp\naturalli\pp.tab.gz' 我试着在网上搜索pp.tab.gz文件，但是找不到。然后，我试图通过禁用亲和力来解决问题： Propertie

浏览 1提问于2015-07-28得票数 1

回答已采纳

1回答

使用开源版本的OpenIE时无法加载CoreNLP模型

、、、

我从coreNLP文件和自述文件中推荐的模型下载了的源代码。我在eclipse中创建了一个新项目，并试图通过它运行openie，返回以下异常： Exception in thread "main" edu.stanford.nlp.io.RuntimeIOException: Could not load clause splitter model at edu/stanford/nlp/models/naturalli/clauseSearcherModel.ser.gz at edu.stanford.nlp.naturalli.OpenIE.<init>

浏览 1提问于2016-05-12得票数 0

回答已采纳

1回答

OpenIE没有得到与演示中所说的相同的结果

我只是下载并试用了一下OpenIE。我在演示中使用了同样的句子“出生在一个小镇上，她乘坐午夜的火车去任何地方。” 在这个页面上：上说会有三个三胞胎被提取出来，但从下面看却错过了三胞胎“她坐了午夜的火车”。这些信息很重要。你能告诉我为什么我得不到和demo中一样的结果吗？有什么参数需要设置吗？谢谢。 tom@tom-Aspire-E5-572G:~/Downloads/stanford-corenlp-full-2015-12-09$ cat input.txt Born in a small town, she took the midnight train going anywhere.

浏览 0提问于2016-11-23得票数 0

1回答

从斯坦福CoreNLP中抽取多个关系三元组

、

我正在尝试从斯坦福CoreNLP中提取关系三元组，它对一个句子中的单个关系三元组非常有效，但似乎不适用于同一句子中的多个概念。例如:我喝水，他吃蛋糕。我预计会有两个三元组。(我，喝水)，(他，吃，蛋糕)，但只有一个会出现。这是我目前正在使用的： with corenlp.CoreNLPClient(annotators="tokenize ssplit lemma pos ner depparse natlog openie".split()) as client: ann = client.annotate(text) sentence = ann.sent

浏览 0提问于2018-02-14得票数 0

1回答

CoreNLP中类似spaCy的依赖图导航

、、

在CoreNLP中是否可以像中描述的那样在spaCy中导航依赖关系解析树？到目前为止，我看到的令牌属性，如引理、POS等都可以通过索引来检索，例如，sent.lemmas(5)返回第六个令牌的引理。我不确定依赖头和关系是否存在这种情况。除了每次浏览整个树之外，有没有一种既定的方式来使用它们？

浏览 12提问于2017-02-28得票数 0

回答已采纳

2回答

Stanford处理文件列表时内存不足的OpenIE

、

我试图使用斯坦福大学的OpenIE工具从几个文件中提取信息，当多个文件被传递到输入时，它会产生内存不足的错误，而不仅仅是一个文件。 All files have been queued; awaiting termination... java.lang.OutOfMemoryError: GC overhead limit exceeded at edu.stanford.nlp.graph.DirectedMultiGraph.outgoingEdgeIterator(DirectedMultiGraph.java:508) at edu.stanford.nlp.semgraph.Sem

浏览 1提问于2016-04-05得票数 3

回答已采纳

1回答

哪种NLP更适合树莓派？

、、、、

我正在寻找一个蓝莓Pi模型B+的NLP库。我试着安装spaCy，但似乎有些包(如blis )不支持32位版本。我也试着从源头上构建。最后我放弃了。现在，我正在寻找一个spaCy替代方案，可以安装在ARM设备，如Pi。应该是快的。斯坦福大学coreNLP会研究Raspberry Pi吗？我读到它又重又慢。

浏览 3提问于2020-06-06得票数 1

1回答

如何使用斯坦福-nlp提供的OpenIEDemo.java生成自定义三元组

、、、

我已经训练了自定义NER和关系提取模型，并且我已经用corenlp服务器检查了生成三元组，但是当我使用OpenIEDemo.java生成三元组时，它生成的三元组只具有关系"has“和" have”，而不是我训练关系提取模型所在的关系。我正在加载自定义NER和关系提取模型，同时运行相同的脚本。这是我的OpenIEDemo.java文件... package edu.stanford.nlp.naturalli; import edu.stanford.nlp.ie.util.RelationTriple; import edu.stanford.nlp.io.IOUtils

浏览 38提问于2019-05-21得票数 1

回答已采纳

1回答

文本预处理的最佳工具，包括标记化、柠檬化、停止字删除、特征向量提取？

、

对于文本处理，有很多工具，比如CoreNLP、SpaCy、NLTK、textblob等等，每个工具都提供不同的预处理功能，人们推荐不同的工具来执行不同的任务，比如NLTK，用于令牌化等等。您推荐哪种工具来执行所有这些任务？

浏览 0提问于2016-11-25得票数 2

1回答

Twitter POS和NER:什么是最先进的？

、、、

twitter数据的pos标记和命名实体识别的最新进展是什么？像Spacy和SparkNLP这样的工业实力程序对这样的文本准确吗？FlairNLP和斯坦福大学的CoreNLP准确性度量如何？

浏览 0提问于2020-07-28得票数 2

1回答

运行斯坦福大学提供的开放信息提取时出错

我试图使用官方网站：中给出的命令运行斯坦福nlp给出的。 java -mx1g -cp stanford-openie.jar:stanford-openie-models.jar edu.stanford.nlp.naturalli.OpenIE mytextfile.txt 但我得到了以下错误： Exception in thread "main" java.lang.NoClassDefFoundError: org/slf4j/LoggerFactory at edu.stanford.nlp.pipeline.StanfordCoreNLP.<clinit&g

浏览 1提问于2015-11-21得票数 6

回答已采纳

1回答

使用OpenIE从命令行提取三元组

、

我有一个大小适中的文件(大约1.5GB)的免费文本，我希望使用OpenIE提取三元组，但我目前有一些问题。我使用以下命令调用它： java -mx2g -cp "*" edu.stanford.nlp.naturalli.OpenIE ./my_file.txt 第一个问题是，这需要大量的内存。即使我允许50 if使用-mx50g，我也会遇到java内存问题。第二个问题是，它似乎没有将输出写入文件，而是将其转储到控制台。将结果重定向到文件中的唯一方法是将输出重定向到文件中。这是我第一次使用这个包，所以我不确定我是不是在做傻事。这种内存使用是否正确，以及如何将结果保存到文

浏览 0提问于2018-08-18得票数 0

1回答

NoClassDefFoundError /knowitall/openie/openIECli

、、

嗨，我在eclipse中运行OpenIE scala代码时出错了。线程"main“edu.knowitall.tool.postag.ClearPostagger.(ClearPostagger.scala:15)中的异常: edu.knowitall.tool.postag.Postagger: method ()V在java.lang.NoSuchMethodError中找不到

浏览 4提问于2014-03-18得票数 0

回答已采纳

1回答

如何从词性标签判断过去完成时

、

“我爱”的过去完成时形式。是“我曾爱过”我正在尝试从POS机标签(使用NLTK，spacy，Stanford CoreNLP)中找出这些过去的完美。我应该寻找什么POS标签？相反的..。我是不是应该找单词have ..的过去形式？这会是详尽的吗？ I PRP PRON had VBD VERB loved VBN VERB . . PUNCT

浏览 35提问于2017-07-16得票数 0

1回答

错误:未找到Python模块“清洁”。安装with: pip在R中安装清洁in

、、

我正在使用R工作室，在Bubuntu18.4，特别是清洁包分析文本根据。根据找到的安装说明，到目前为止，我已经在Rstudio的控制台中安装了类似于install.packages("cleanNLP")的清理程序。此外，我还在终端中安装了它的模块pip install cleannlp。据我所见，这两种装置我都没有遇到任何问题。如安装说明所示，清洁的后端有4个： cnlp_init_stringi(locale="en_GB") cnlp_init_udpipe(model_name="english") cnlp_init_spacy(m

浏览 3提问于2020-04-10得票数 1

回答已采纳

1回答

stanford中线程"main“java.lang.NoClassDefFoundError中的异常

、

我已经下载了，我已经完成了下的安装。当我运行这段代码时 >>> from stanford_corenlp_pywrapper import CoreNLP >>> proc = CoreNLP("pos", corenlp_jars=["/home/sw/corenlp/stanford-corenlp-full-2015-04-20/*"]) 我已将jar的位置更改如下： proc = CoreNLP("pos", corenlp_jars=["/media/pglab1-uni2/1EF20A7

浏览 8提问于2016-02-10得票数 1

4回答

如何用SpaCy解决西班牙语柠檬化问题？

、、

当在西班牙语中尝试混合词时，SpaCy没有正确地写出某些单词，我理解该模型并不是100%的精确性。但是，我没有找到任何其他解决方案，因为NLTK没有带来西班牙语内核。一个朋友试图用西班牙语来问这个问题，但是，这个社区和这个社区相比还是很小的，而我们却没有得到任何答案。代码： nlp = spacy.load('es_core_news_sm') def lemmatizer(text): doc = nlp(text) return ' '.join([word.lemma_ for word in doc]) df['column&

浏览 0提问于2020-03-04得票数 9

回答已采纳

1回答

StanfordNLP Openie失败

、

我让StanfordNLP启动并运行。我的maven依赖结构如下： <dependency> <groupId>edu.stanford.nlp</groupId> <artifactId>stanford-corenlp</artifactId> <version>3.6.0</version> </dependency> <dependency> <groupId>edu.stanford.nlp</groupId>

浏览 1提问于2016-06-12得票数 0

回答已采纳

1回答

斯坦福NLP OpenIE未能识别某些句子的三元组

、、

我试过使用核心库和它周围的简单包装器，但都找不到相同的琐碎句子的三元组。简单的包装代码： for (final Quadruple<String, String, String, Double> tripple : sentence.openie()) { System.out.println(tripple); } 核心库的代码是 package edu.stanford.nlp.naturalli; import edu.stanford.nlp.ie.util.RelationTriple; import edu.stanford.nlp.

浏览 2提问于2016-07-02得票数 1

1回答

python中的子句提取/长句切分

、、、、

我目前正在做一个涉及句子向量的项目(来自RoBERTa预训练模型)。当句子很长时，这些向量的质量较低，并且我的语料库包含许多带子句的长句。我一直在寻找从句提取/长句分割的方法，但我惊讶地发现，没有一个主要的NLP包(例如spacy或stanza)提供这种开箱即用的功能。我认为这可以通过使用spacy或stanza的依赖关系解析来完成，但正确处理所有类型的复杂句子和边缘情况可能会相当复杂。我遇到过ClausIE信息提取系统的this implementation和spacy，它做了类似的事情，但它还没有更新，也不能在我的机器上工作。我也遇到过用于句子简化的this repo，但是当我在

浏览 48提问于2020-12-10得票数 3

1回答

面对在PYTHON中设置Stanford的困难

、

我找不到一个完整的教程在我的系统(windows)上使用python使用stanford。在大量搜索之后，我正在使用StanfordCoreNLP包，并在我的系统上使用。我找不到任何更有效地使用它的文档。我想提取关系和OPENIE，因为在我刚刚尝试将OpenIE放在属性中的任何地方都没有文档 self.props = { 'annotators': 'tokenize,ssplit,pos,lemma,ner,parse,depparse,dcoref,relation,OpenIE', 'pipeline

浏览 3提问于2019-10-29得票数 0

1回答

用最快的方法对句子进行符号化

、、、

因此，我目前正在构建一个分类管道，此时corenlp狐猴似乎是一个相当重要的瓶颈。我试图弄清楚，我的狐猴化是导致经济放缓的原因，还是总体上来说，狐猴化只是缓慢的。以下是我的当前代码： def singleStanfordSentenceToLemmas(sentence: String): Seq[String] = { val doc = new Annotation(sentence) pipeline.annotate(doc) val tokens = doc.get(classOf[TokensAnnotation]).toList tokens.

浏览 5提问于2015-11-02得票数 1

回答已采纳

1回答

在spaCy中从词根(引理)和词性部分(POS)标记中获取完整的单词“文本”。

、、

如何将词根和部分词性标记组合成一个完全修改的单词？例如： getText('easy', 'adjective', 'superlative') --> 'easiest' getText('eat', 'verb', '3rd-person-singular') --> 'eats' getText('spoon', 'noun', 'plural') -->

浏览 3提问于2017-12-26得票数 3

回答已采纳

1回答

可以在标准的SpaCy管道中使用外部向量器吗？

、、、

我有一个脚本，它几乎完全依赖于SpaCy来完成一系列的nlp任务。因为默认情况下SpaCy只支持3种英文模型(sm、md、lg)，所以我想用一个外部模型替换它们，这样我就可以向量化我的文本，并执行我目前正在执行的所有SpaCy方法。有没有可能用其他东西替换nlp = spacy.load('en_core_web_lg')行，而不影响管道的其余部分？例如，通过使用transformers库中支持的语言模型之一定义'nlp‘？例如，我使用SpaCy的(a).similarity(b)方法，除了基于非默认语言模型生成的单词向量进行计算外，我希望保留包含此方法的管道。

浏览 20提问于2021-01-12得票数 1

回答已采纳

3回答

python中的主体对象标识

、

我想确定一组句子的主语和宾语。我的实际工作是从一组审查数据中确定因果关系。我正在使用Spacy Package来分块和解析数据。但并没有真正达到我的目标。有没有办法做到这一点？例如： I thought it was the complete set 输出： subject object I complete set

浏览 0提问于2016-05-18得票数 2