首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >学习多线程Java爬虫的良好开端

学习多线程Java爬虫的良好开端
EN

Stack Overflow用户
提问于 2012-04-16 20:01:14
回答 1查看 679关注 0票数 0

我正在用Java开发一个网络爬虫。我正在寻找一个很好的项目开发这个爬虫的基础上。然而,实际上有超过几百个用Java编写的爬虫程序。我要找的是一个相当简单的爬虫,它有:

基于最新的Java构建和新的functionality

  • Good performance

  • Implemented好documentation

  • Not的
  • 多线程documentation
  • Not许多不必要的特性(bloats)
  • Ability很容易集成到我的项目

中。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-04-17 20:39:34

我要找的是一个相当简单的爬虫.

你不会发现的,爬虫没什么简单的!有这些特性(特别是最后一个要点)并不简单:

基于最新的Java构建和新技术的多线程functionality

  • Good performance

  • Implemented ( documentation

  • Not

  • )好的有很多不必要的特性(bloats)
  • Ability可以很容易地集成到项目

中。

Nutch是一个功能齐全的Java爬虫,可以满足您的大部分需求:http://nutch.apache.org/

此外,我建议您查看以下问题:https://stackoverflow.com/questions/2495289/what-is-a-good-java-web-crawler-library

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10180813

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档