我有一组给定的keywords,我知道它只与我的应用程序相关。但这些关键字在不同的上下文中可以有不同的含义。只有一个意思对我有用,我事先就知道了。如何在运行时disambiguate它们的含义?
我试过在市场上使用不同的Word Sense Disambiguation方法,但结果很差?
有人能帮我吗?
发布于 2015-02-20 05:08:59
词义消歧是一个悬而未决的问题,因此任何方法的成功都将在很大程度上取决于您的特定数据。如果你在运行时提供的关键字周围有足够的上下文,你可以计算tf-idf (http://en.wikipedia.org/wiki/Tf%E2%80%93idf),并将它与你感兴趣的词义的预先建立的tf-idf进行比较:当然,这意味着只有你感兴趣的词义出现时才有训练数据。然后,您可以比较两个tf-idf向量,如果根据您可以通过实验建立的某个阈值,它们足够相似(http://en.wikipedia.org/wiki/Cosine_similarity),那么您可以得出结论,它们具有相同的意义。祝好运。
https://stackoverflow.com/questions/28609735
复制相似问题