我想知道solr5是如何实现分布式IDF的。我们有自己的基于lucene的分布式搜索引擎,我们希望利用分布式IDF的优势。搜索谷歌,我没有找到任何线索,solr5是如何实现以下策略的:
LocalStatsCache: Local document stats.
ExactStatsCache: One time use aggregation
ExactSharedStatsCache: Stats shared across requests
LRUStatsCache: Stats shared in an LRU cache across requests
是否有任何描述其架构的文档?或者对设计这样的东西有什么建议吗?
发布于 2015-08-05 18:58:55
SOLR-1632是跟踪Solr5中分布式统计支持(这是分布式idf支持的一部分)的实现的JIRA问题。它还包括补丁,因此您应该能够看到有关实际实现是如何完成的任何详细信息。
仍然有很多文档讨论每个分片的tf/idf分数,尽管在这一点上这可能只是过时的文档。
https://stackoverflow.com/questions/31802043
复制相似问题