OpenNLP能够从内容中提取关键字吗?如果是,怎么做?如果没有,我应该使用哪种工具?
我想自动标记内容。例如。
杰西卡·查斯顿透露,已经和漫威就一个未透露的角色举行了一次会面,尽管这位明星已经证实这不是漫威船长。查斯顿在接受MTV采访时说:“我们已经讨论过在未来调整我们的军队的问题。”“我要说的是,…如果你要演一部超级英雄电影,你只有一次机会。““你永远是那个角色。那为什么要拍超级英雄电影,演无聊的平民呢?“可能是玛雅·汉森的名字?查斯顿被附在“钢铁侠3”的角色上,后来由于调度上的困难而退出,…“我不想说太多,”这位明星继续说,“但有一件事,这个角色将来有可能成为…我说,‘我明白,但我现在就想这么做!’“这个角色究竟是谁,还有待解释,尽管查斯顿已经改变了后来关于她将扮演漫威船长的传言。
应该贴上“超级英雄”、“电影”的标签。
OpenNLP能够做到这一点吗?谢谢。
发布于 2014-11-13 01:05:28
OpenNLP能够为您提取命名实体。这意味着任何一个人、地点、组织等的名称都可能被系统所识别。
然而,您正在寻找的是关键字提取,您想要识别相关的关键字,解释一个文件的一般意义。我建议查看Alchemyapi.com,它们有模型来提取关键字、分类法、命名实体等等。唯一的问题是免费版本每天只为您提供1000个事务(这可能足以满足您的任务)。
https://stackoverflow.com/questions/26731128
复制相似问题