在实际爬取数据时,我们可能不需要对整个网站数据进行爬取。因此,如果可以增加一个功能,对目标网站的最大爬取深度,可以灵活配置,那该多好。接下来,我们就来编写一个具有配置最大爬取深度功能的爬虫程序。
有了这个功能,我们就可以很方便灵活的,进行数据爬取了。如果你想要禁用这个功能,可以将max_depth设置为负数即可 。
本文分享自 TalkPython 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!