我试图弄清楚一个句子的主语,也就是句子在说什么(而不是语法主语,它可能是不同的)。
到目前为止,我得到了
1.)Java中的OpenNLP,它为我提供了句子检测、词性标记、解析、标记器和名称查找器。
2.)MatlParser,stanford Parser -它可以通过依存句法分析给出简单句子的语法主语。
我认为一个名词或一个名词短语总是在更一般的意义上是主语,但一个句子可以有许多名词和名词短语。任何帮助都将不胜感激。
发布于 2012-10-04 23:48:47
正如您正确指出的那样,语法是不够的。人们将不得不使用某种形式的浅层语义分析来识别您所称的“主体”。我认为在SRL (语义角色标签)的上下文中,它更多地被称为Agent。有一些开源工具(例如UIUC SRL parser)可以执行语义角色标注,至少在英语中是这样,但它们通常作用于单独的谓语,在一个句子中可能有几个谓语,所以人们必须以某种方式找出哪个“主语”是“主要”的。
我不认为后一种概念定义得很好,事实上,在一个复杂的句子中,可能不清楚哪个主语是“主要”主语。它可能对特定类型的句子更有意义,但不是一般意义上的。我认为如果你描述你正在处理的数据和/或给出一些例子,会有所帮助。
另外,你可以考虑在https://linguistics.stackexchange.com/上问这个问题
https://stackoverflow.com/questions/12713557
复制相似问题