撸个小项目玩2

一、当前进度

1、实现任意输入公号抓取

下图以抓取「风巢」、「caozsay」、「小道消息」为例。

2、实现网页自动批量转 pdf

工具: wkhtmltopdf

网址:https://wkhtmltopdf.org/

3、完成 Git 版本控制系统搭建

工具:SourceTree 版本管理软件

网址:https://www.sourcetreeapp.com/

代码托管:Bitbucket,可建立无限多私有 Repositories

网址:https://bitbucket.org

二、遇到问题

文章自动化抓取时会报「参数错误」。

文章链接可通过生成的 HTML 目录直接点击打开,用 IDLE 逐个打开也无问题。批量抓取设置延时也未解决。

明天继续尝试,如仍无法解决则考虑换用 Selenium 驱动浏览器方案。

三、其他

最近在刷以下两本书:

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180508G20CHJ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券