我正在尝试在网站上进行良好的自然语言搜索,并试图了解Apache Solr与Xapian的优势。Xapian似乎更容易设置。两者都提供很好的自然语言搜索吗?任何有见地的人都很欣赏。
发布于 2012-04-12 05:35:38
Xapian更像是Lucene,一个可以集成到应用程序中的库。如果你有一个C++应用程序,那么Xapian可能是一个更好的匹配。如果您有一个Java应用程序,Lucene几乎肯定是最好的选择。
如果你想要一个搜索服务器,那么比较一下Omega (构建在Xapian上)和Solr (构建在Lucene上)。我没有使用Omega或Xapian,但Solr有一些我已经依赖的特性,特别是每个字段的分析链。这是一个聪明的想法,我希望我在开发Ultraseek的时候就想到了这个想法。
用您自己的Java类扩展Solr分析链非常容易。我预计在使用Omega/Xapian的C++中会更加困难。
这两个引擎使用不同的底层相关性模型。Xapian是一个概率引擎,Lucene是一个向量空间引擎。我已经看到这两种模型都进行了性能调整,因此这可能不是决定的理由。
Solr/Lucene社区很大,非常有帮助。
https://stackoverflow.com/questions/8666924
复制相似问题