我正在做一个项目,在这个项目中,我需要根据搜索查询对文本文档进行排名,但我需要对具有单词或句子的语义相似度的文档进行排名,我无法开始关于如何使用java找到语义相似度。是否有任何链接或论文可以让我开始在文档或任何想法中找到单词的语义相似度。
发布于 2014-06-26 19:33:39
在术语空间中表示文档的标准方法是将术语视为相互正交或彼此独立,例如,术语“原子”和“核”虽然是同义的,因此可互换,但被视为不同的,而这对单词之间的语义相似度应该相当高。
因此,为了实现基于语义相似度的分数,您需要知道一对单词之间的关系,您可以使用以下任一方法。
原子性分析外部资源或诸如潜在语义分析方法之类的语义相似性库,例如潜在语义分析方法( DISCO.
发布于 2014-06-27 15:06:06
看看这个Demo for semantic similarity
它展示了不同算法的演示。你可以看看哪一个适合你,然后试着去做。另外,我认为这个"semilar“模块可以在Java的帮助下使用。你可以试着使用它,我还没有试过,但是在那个页面上的演示是相同的。谢谢:)
https://stackoverflow.com/questions/24407333
复制相似问题