[小工具][Python爬虫]一键完整备份你的Csdn博客文章(支持Markdown,HTML,文中图片)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/qqxx6661/article/details/98473601

前言

一直想将自己的Csdn博客完整地备份到本地,以免一些老文章以后落得个404(打不开)的下场。

每家的博客或多或少都有一些博客备份的功能(例如简书在设置中能够打包自己的所有md文章,但是不支持图片导出)。

然而Csdn在这方面一直做的不够好,好几次想做备份,都想不到好的解决方案,无奈只能寻求Github的帮助。最近,在众多杂七杂八的库中,终于让我找到了一个接近完美的解决方案:CAB-Tool。

本工具出自他人之手,我只修复了一个小Bug,由于工具确实能够完整备份我的260+博客,没有出现账号异常或者是中途中断的情况,故诚心推荐给有需要之人,也希望大家可以完善工具,多提issue和pull request。

CAB-Tool

Github地址:

https://github.com/SnailMann/CAB-Tool

简介

摘自 README.md

CAB Tool 就是csdn-article-backp-tool,只是我有点懒,不想打这么长,还能顺便装的一手好逼 (狗头)

功能:

  • 支持批量备份markdown语法写的csdn博客
  • 支持备份博客图片(兼容markdown语法,html语法)
  • 支持两种使用方式,便于没有python基础的同学使用

注意:

  • 目前不支持备份私密文章,只能备份自己的公开文章
  • 需要登录账户密码(markdown编辑器的爬取需要cookies)
  • CAB Tool 直接爬取的是csdn markdown编辑器的文本,备份的文本与编辑器上无异

使用

方式一

如果你是没有任何python基础的同学,或是懒得安装py环境。没有关系,这里也是支持小白式运行的

  • 点击cab-tool releases,下载cabtool.exe的最新版本
  • 双击运行cabtool.exe就好啦

方式二

第一步

  • 把项目克隆本地git clone git@github.com:SnailMann/CAB-Tool.git
  • 确保本地有python3的环境, 并且可以使用pip安装依赖
  • 进入项目目录,命令行输入pip install -r requirements.txt,使用pip安装py项目的必要依赖

第二步

  • 打开setting.yaml配置文件
  • 按照yaml规范填写CSDN的账号密码
  • 按照yaml规范在download-path填写本地导出地址,不填默认为D:\csdn-blog-backup
  • 按照yaml规范在download-img填写是否开启图片备份 TrueFalse
  • 按照yaml规范在sleep-time填写备份文章的时间间隔,单位是s,默认是1s。若非有需要,不建议改动

第三步

  • 确认配置无误后
  • 项目路径打开命令行,输入py main.py

效果

完整备份了230+markdown:

后记

如果大家还发现什么好用的,好玩的工具,都可以推荐给我试试,哈哈哈哈。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券