有人建议我们使用mysql进行站点搜索,因为它将运行在承载web服务器(nginx)和db (mysql)的同一台服务器上。
因为并不是所有的页面都是从数据库中创建的,所以有人建议我们有一个爬虫,可以抓取站点,并将页面url和数据丢到mysql中,并在上面有sphinx索引。
有没有人知道开放源码蜘蛛,它有一个mysql存储选项。
谢谢。
发布于 2010-03-17 15:54:55
我想斯派德是你要找的-我们以前有好的结果。此外,它还可以索引pdfs和docs,这是非常有用的。
http://www.sphider.eu/
https://serverfault.com/questions/115414
复制相似问题