我目前正在从事一个项目,涉及从各种(约50个网站)爬行数据。有一个网站有多个页面我们需要抓取,但这个网站不允许多个会话。(网站已通过身份验证)。
有没有办法暂停一个爬虫,直到另一个蜘蛛完成?
我在过去的一天里一直在研究这个。我发现了一些可以暂停的方法,但似乎这些方法只对整个CrawlerProcess有效。
https://stackoverflow.com/questions/56114106
相似问题