我在GitHub上有个Python的爬虫仓库,收集了一些我爬虫学习与实战的代码。里面包含了一些基础内容,也包含了一些中阶的技巧,工具的使用。
主要有XPath、BeautifulSoup、正则表达式、Ajax异步加载、代理IP、多线程、Fiddler的使用、字体反爬、JS逆向、Scrapy框架的使用、反调试问题、验证码。
一般文章的代码及其相关文件都可以在这个仓库中找到~
给出链接
https://github.com/librauee/Reptile
本文分享自 算法与数据之美 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!