我有大量的基本文本、rtf、html、pdf和chm文件,我将它们存储在U盘上作为个人知识库。
到目前为止,为了检索信息,我使用了标准的文件搜索工具(windows search,grep等)。然而,如今,由于数据量太大,暴力搜索可能需要几分钟的时间。此外,PDF和CHM也更难搜索。
因此,我正在寻找一个文本索引工具,将在这种情况下很好地工作。我想避免依赖关系型数据库管理系统(如SQL Server,MySQL),因为我会在许多不同的计算机上使用它,不想要安装麻烦。一个可移植的工具将是理想的。在一些机器上,我也经常无法访问互联网。
如果能提供一个简单的GUI,允许查询输入和快速访问结果,那就更好了。
我已经考虑过自己写这篇文章,但是这比我现在有时间做的要多一点。
发布于 2009-04-27 05:11:31
Google Desktop会为您建立索引,Windows Desktop Search也是如此(在Windows中)。Beagle是一个很棒的Linux搜索工具。
发布于 2009-04-27 05:58:14
如果你想尝试一下,我会使用Lucene --要么是纯java版本,要么是https://lucene.apache.org/的副本。
这是一个全文索引和搜索库,非常适合在usb上运行。
https://stackoverflow.com/questions/792303
复制相似问题