CoreNLP返回的三元组数比我们预期的要多,即整个句子或短语,而不是构成句子所传达的基本或基本信息的一两个三元组。
例如,在句子中:
“2011年11月11日16:00 CDT,罗伊·科伊·MD ( Roy )将初步诊断通知汤姆博士。”
我们期望这三倍:
preliminary diagnosis; be notify to; Dr. Tom
但我们得到了像这样的三倍:
1.0 diagnosis be notify by Roy Coy MD at 16:00 cdt on 11/11/2011
1.0 diagnosis be notify to Dr. Tom at 16:00
我想为新闻数据集创建一个本体。我的任务是将实体关系从corenlp转换为本体。
我已经使用Stanford corenlp提取了关系。
for k in range(0,50):
text = df['event_summary'][k]
print('sentence:'+text+ '\n')
output = nlp.annotate(text, properties={"annotators":"tokenize,ssplit,pos,depparse,natlog,openie",
我正在尝试使用CoreNLP测试/运行斯坦福大学的OpenIE程序。
下面是我的命令:java -mx1g -cp stanford-corenlp-3.6.0.jar;stanford-corenlp-3.6.0-models.jar;CoreNLP-to-HTML.xsl;slf4j-api.jar;slf4j-simple.jar edu.stanford.nlp.naturalli.OpenIE
我的输入文件包含以下文本:
Born in Honolulu, Hawaii, Obama is a US Citizen.
Born in a small town, she took
我得到以下错误:
可捕获的致命错误:传递给CorenlpAdapter::getOutput()的参数1必须是字符串的实例,在第22行的/Library/WebServer/Documents/website/php-stanford-corenlp-adapter/index.php中调用,在第95行的/Library/WebServer/Documents/website/php-stanford-corenlp-adapter/src/CoreNLP/CorenlpAdapter.php中定义
index.php 21和22包含:
$text1 = 'I will meet Ma
我一直试图使用与斯坦福大学CoreNLP 3.5.2打包的自然逻辑推理组件(Naturalli)来提取关系triples...however,在创建一个新的OpenIE实例时,我得到了以下例外:
Could not load affinity model at edu/stanford/nlp/naturalli/: Could not find a part of the path '...\edu\stanford\nlp\naturalli\pp.tab.gz'
我试着在网上搜索pp.tab.gz文件,但是找不到。然后,我试图通过禁用亲和力来解决问题:
Propertie
我从coreNLP文件和自述文件中推荐的模型下载了的源代码。我在eclipse中创建了一个新项目,并试图通过它运行openie,返回以下异常:
Exception in thread "main" edu.stanford.nlp.io.RuntimeIOException: Could not load clause splitter model at edu/stanford/nlp/models/naturalli/clauseSearcherModel.ser.gz
at edu.stanford.nlp.naturalli.OpenIE.<init>
我只是下载并试用了一下OpenIE。我在演示中使用了同样的句子“出生在一个小镇上,她乘坐午夜的火车去任何地方。”
在这个页面上:上说会有三个三胞胎被提取出来,但从下面看却错过了三胞胎“她坐了午夜的火车”。这些信息很重要。
你能告诉我为什么我得不到和demo中一样的结果吗?有什么参数需要设置吗?
谢谢。
tom@tom-Aspire-E5-572G:~/Downloads/stanford-corenlp-full-2015-12-09$ cat input.txt
Born in a small town, she took the midnight train going anywhere.
我试图使用斯坦福大学的OpenIE工具从几个文件中提取信息,当多个文件被传递到输入时,它会产生内存不足的错误,而不仅仅是一个文件。
All files have been queued; awaiting termination...
java.lang.OutOfMemoryError: GC overhead limit exceeded
at edu.stanford.nlp.graph.DirectedMultiGraph.outgoingEdgeIterator(DirectedMultiGraph.java:508)
at edu.stanford.nlp.semgraph.Sem
“我爱”的过去完成时形式。是“我曾爱过”我正在尝试从POS机标签(使用NLTK,spacy,Stanford CoreNLP)中找出这些过去的完美。我应该寻找什么POS标签?相反的..。我是不是应该找单词have ..的过去形式?这会是详尽的吗?
I PRP PRON had VBD VERB loved VBN VERB . . PUNCT
我想确定一组句子的主语和宾语。我的实际工作是从一组审查数据中确定因果关系。
我正在使用Spacy Package来分块和解析数据。但并没有真正达到我的目标。有没有办法做到这一点?
例如:
I thought it was the complete set
输出:
subject object
I complete set