目前正在收集信息,我应该使用Nutch与Solr (领域-垂直网络搜索)。
你能推荐我吗?
发布于 2010-05-12 20:46:21
Nutch是一个构建网络爬虫和搜索引擎的框架。Nutch可以完成从网页收集到建立倒排索引的整个过程。它还可以将这些索引推送到Solr。
Solr主要是一个支持分面搜索和许多其他整洁功能的搜索引擎。但是Solr不会获取数据,您必须提供数据。
因此,在这两者之间进行选择的第一件事可能是要索引的数据是否已经可用(在XML中,在CMS中或数据库中)。在这种情况下,您可能只需要使用Solr并将数据提供给它。另一方面,如果你必须从web上获取数据,你可能会更好地使用Nutch。
https://stackoverflow.com/questions/2818112
复制相似问题