微信公众号文章爬虫

月小水长

一个编码者、思考者

前段时间一直在研究微信公众号爬虫,终于得到一个稳定爬取的办法,目前已稳定运行一月有余,爬取结果保存的 csv 文件结构如下

支持爬取任意公众号的所有文章,包括链接、标题、导语、正文及原图的 URL 链接、阅读量、点赞数,支持断点下载(需要在配置文件中配置),唯一缺点可能就是为了反反爬在程序中加入了限速的代码导致效率不是非常高,爬取速度在 120篇/10分钟左右。

为此,特意写了一份配置教程,

我已经将打包成脱离 Python 环境的工具,而且不需要手机辅助;工具加入了密钥,只有经过我获得的该工具才会保证密钥的有效性,才能保证工具的顺利运行,因为我会定期更新密钥。

非常欢迎有兴趣的同学前来交流相关技术,只要有空,义务解答。

如果有对商业版感兴趣的话,可以小窗私聊我,因为是本人辛勤劳动的成功,希望您能理解,感谢您的配合。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191011A0N1O100?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励