我在一家新公司工作,我们的目标之一是为我们的团队和客户实现一个文档搜索门户。我有点担心,如果我们在云中使用像Salesforce或其他ECM这样的外部服务提供商,未来将会有大量的集成工作。从客户端的角度来看,这些文档也将与我们的结构化内容存在于同一存储桶中(存储在数据库中,而不是MS Word文档中)。
如果您已经实现了文档搜索,那么您使用了哪些语言、框架和技术?你有什么失败的故事吗?使用开箱即用的东西我没有问题,但我认为我们能够控制文档和访问它们的API是很重要的。如果我们完全自定义的话,我想使用Rails。
发布于 2010-06-11 11:18:29
Lucene可能是最安全的选择,因为它被广泛使用并且相当不错。
从Lucene中获益的最简单的方式可能是使用Alfresco,它的安装非常容易,并且默认情况下使用Lucene。这意味着你只需要安装Alfresco,将你的文档放入存储库中,然后你就可以使用强大的网络搜索界面来搜索你的文档。
如果你需要以编程方式进行搜索,我的建议是使用Alfresco的CMIS接口,它允许你以REST方式进行搜索。JCR也是可用的。
https://stackoverflow.com/questions/2765922
复制相似问题