首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Lucene/Solr,Whoosh,Sphinx,Xapian中的文档搜索

Lucene/Solr,Whoosh,Sphinx,Xapian中的文档搜索
EN

Stack Overflow用户
提问于 2011-07-17 15:27:11
回答 1查看 984关注 0票数 1

我正在比较Lucene/Solr、Whoosh、Sphinx和Xapian在DOC、DOCX、HTML和PDF中搜索文档。只有Solr被记录为有一个直接索引文档的文档解析器(Tika)。因此,这似乎是一个明显的赢家。

但为了公平竞争,我喜欢考虑其他选择。其他的是否有直接文档索引(我可能漏掉了)?如果不是,它们能否很容易地实现?还是Solr是压倒性的选择?

EN

回答 1

Stack Overflow用户

发布于 2013-04-12 14:24:15

在Sphinx上,您可以通过xmlpipe_command选项使用PHP脚本转换文件。因为PHP有一个Tika包装器,所以编写脚本和设置本身并不困难。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6724813

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档