我不是一个流利的英语演讲者,所以这个问题对于以英语为母语的人来说可能是微不足道的。
我正在实现一个自然语言处理系统。我需要通过与其他几个单词的组合来提取具有含义的术语。
例如,我应该从“我在喝低脂牛奶”中提取“我”,“是”,“正在喝”,“低脂”,“低脂牛奶”。有可能吗?
发布于 2017-10-03 00:00:33
您可以通过提取单词之间的语法依存关系来实现所需的功能。例如,在这里,“低”和“胖”都是名词“牛奶”的形容词修饰语。一旦找到了这些依赖项,您就可以专注于所需的依赖项。
要找出这些依赖项,可以使用Stanford dependency parser,它在Java中可用。您可以尝试使用在线版本的解析器here。
最后,此paper使您能够详细了解解析器和标记的含义。
示例:
对于上面的句子,您将从解析器获得以下关系,其中"amod“表示形容词修饰语:
root ( ROOT-0 , drinking-3 ) nsubj ( drinking-3 , I-1 ) aux ( drinking-3 , am-2 ) amod ( milk-6 , low-4 ) amod ( milk-6 , fat-5 ) dobj ( drinking-3 , milk-6 )
https://stackoverflow.com/questions/46525675
复制相似问题