首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >检索文件内容

检索文件内容
EN

Stack Overflow用户
提问于 2014-02-05 12:07:07
回答 1查看 54关注 0票数 0

好的,我计划在我的内部网中创建一个本地搜索引擎,它搜索xls、xlsx、doc、docx、pdb等文件的内容。

在网上搜索之后,我想卢克·卢塞尼可以用来做这件事。我说的对吗?Lucene能被整合到一个网站中吗?

我有大约500 Gb的文件,Lucene能处理这些文件吗?还有别的选择吗?

我只知道C和C的基本知识。我对此没有任何先验知识。我是一个自学的人,请给我一本关于Lucene的好书。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-02-05 14:43:54

是的,Lucene可以用来做这个。但是你需要自己编写一些代码(因为Lucene只是一个库):-爬行代码-文本提取-构建一个搜索应用程序。

因此,您可以更好地查看索尔,它构建在Lucene之上,并且有许多内置的特性可以使用:您可以使用任何语言和迪赫访问的可靠服务器,以及用于文本提取的蒂卡集成等等。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21576829

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档