首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Nutch的替代网络爬虫

Nutch的替代网络爬虫
EN

Stack Overflow用户
提问于 2010-11-25 01:24:06
回答 5查看 9.5K关注 0票数 20

我正在尝试建立一个专门的搜索引擎网站,索引有限数量的网站。我想出的解决方案是:

  • 使用Nutch作为网络爬虫,
  • 使用Solr作为搜索引擎,
  • 作为前端,站点逻辑使用Wicket编码。

问题是我发现Nutch相当复杂,而且它是一个需要定制的大软件,尽管有一个详细的文档(书籍,最近的教程..等)并不存在。

现在提出问题:

  1. 对这个网站的漏洞有什么建设性的批评吗?
  2. 有没有一个既好又简单的替代方案(作为网站的爬行部分)?

谢谢

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4269632

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档