for (int i = 1; i < 10; i++) {
        String url = "http://exampleurl.com/index.php?page=" + i;
        Document doc = Jsoup.connect(url).get();
    }

希望这能给你带来一些启发。该代码将循环通过具有分页的网站中的十个页面。

票数 1

Stack Overflow用户

发布于 2014-05-25 06:06:35

如果站点使用rel="next"注释其分页链接，则可以使用这些链接检索更多页面。

除此之外，HTML本身并没有指定分页中页面之间的关系。你必须使用启发式(例如，包含“下一步”的文本的链接或具有递增数字的链接序列(1，2，3...最后))。显然，这些启发式方法并不适用于每个站点，并且当站点的设计更新时可能会停止工作。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/14773465

复制

相似问题

问使用自定义爬虫访问分页中的所有页面
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用自定义爬虫访问分页中的所有页面EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用自定义爬虫访问分页中的所有页面
EN