希望使用Sphinx进行网站搜索,但并不是我的所有网站都在mysql中。而不是重新发明轮子,只是想知道是否有一个开放源码的爬行器,可以轻松地将其结果抛入mysql数据库中,以便Sphinx可以对其进行索引。
谢谢你的建议。
发布于 2009-10-29 22:21:19
还有可以将文档提供给Sphinx的XML pipe数据源。我不确定设置将站点内容作为XML输出是否比将其插入到DB中更容易,但这是一个选择。
发布于 2009-10-29 22:32:06
如果你不是100%坚持使用Sphinx,你可以考虑像这个网站那样使用Lucerne?不管底层技术是什么(数据库驱动还是静态页面),这都应该是可行的。
我目前也在寻求实现一个网站搜索。This问题也可能会有所帮助。
https://stackoverflow.com/questions/1641042
复制相似问题