好的,我计划在我的内部网中创建一个本地搜索引擎,它搜索xls、xlsx、doc、docx、pdb等文件的内容。
在网上搜索之后,我想卢克·卢塞尼可以用来做这件事。我说的对吗?Lucene能被整合到一个网站中吗?
我有大约500 Gb的文件,Lucene能处理这些文件吗?还有别的选择吗?
我只知道C和C的基本知识。我对此没有任何先验知识。我是一个自学的人,请给我一本关于Lucene的好书。
发布于 2014-02-05 14:43:54
是的,Lucene可以用来做这个。但是你需要自己编写一些代码(因为Lucene只是一个库):-爬行代码-文本提取-构建一个搜索应用程序。
因此,您可以更好地查看索尔,它构建在Lucene之上,并且有许多内置的特性可以使用:您可以使用任何语言和迪赫访问的可靠服务器,以及用于文本提取的蒂卡集成等等。
https://stackoverflow.com/questions/21576829
复制相似问题