在工作中,我们在许多不同的站点中保存了大量信息-- wiki、产品文档、票务系统等等--其中许多需要认证。
我非常感兴趣的是有一个单一的方式搜索我们所有的各种筒仓,在我的业余时间看了努奇,格鲁布,Django +海堆栈等。这些都不是一个完整的解决方案,la谷歌迷你或谷歌搜索设备。
有没有人在这些工具的混合基础上建立了一个基本的内联网搜索引擎?你能给我建议一下怎么做吗?我喜欢Django,而Hay堆栈似乎是一个稍微流行的搜索解决方案,但我需要连接一个爬虫,它可以支持爬行认证的网站。
发布于 2011-03-05 02:32:08
Vivisimo速度是一个伟大的产品,但昂贵。
发布于 2011-03-05 02:56:44
看看Apache的卢塞尼。还可以看看他们的PoweredBy wiki页面,也许你甚至可以找到一个已经在使用lucene的项目。
https://serverfault.com/questions/243453
复制相似问题