我想用Spacy计算一个实体的频率。然而,有时实体也被称为其他东西。例如:
“乔·拜登总统登上了空军一号”
我希望我的计数器为乔·拜登返回2,因为在下面的句子中,他曾被称为“乔·拜登”和“总统”。有没有一种方法可以用Spacy以一种通用的方式来完成?例如,还为"CEO蒂姆·库克。CEO做过XYZ“等工作。
谢谢你的帮助!
发布于 2021-11-12 03:54:06
要做到这一点,您需要一个共同引用模型。共指模型告诉您提及(文本的跨度,如实体)指的是同一事物。
spaCy目前还没有一个可用的共同引用模型,但是一个模型正在开发中,或者您可以尝试coreferee。
https://stackoverflow.com/questions/69936122
复制相似问题