月小水长
一个编码者、思考者
前段时间一直在研究微信公众号爬虫,终于得到一个稳定爬取的办法,目前已稳定运行一月有余,爬取结果保存的 csv 文件结构如下
支持爬取任意公众号的所有文章,包括链接、标题、导语、正文及原图的 URL 链接、阅读量、点赞数,支持断点下载(需要在配置文件中配置),唯一缺点可能就是为了反反爬在程序中加入了限速的代码导致效率不是非常高,爬取速度在 120篇/10分钟左右。
为此,特意写了一份配置教程,
我已经将打包成脱离 Python 环境的工具,而且不需要手机辅助;工具加入了密钥,只有经过我获得的该工具才会保证密钥的有效性,才能保证工具的顺利运行,因为我会定期更新密钥。
非常欢迎有兴趣的同学前来交流相关技术,只要有空,义务解答。
如果有对商业版感兴趣的话,可以小窗私聊我,因为是本人辛勤劳动的成功,希望您能理解,感谢您的配合。
领取专属 10元无门槛券
私享最新 技术干货