前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一键下载百度文库/豆丁/道客巴巴文档,支持导出PDF,Word,txt 文件

一键下载百度文库/豆丁/道客巴巴文档,支持导出PDF,Word,txt 文件

作者头像
苏生不惑
发布2020-12-15 09:52:09
19.5K0
发布2020-12-15 09:52:09
举报
文章被收录于专栏:苏生不惑

苏生不惑第198 篇原创文章,将本公众号设为星标,第一时间看最新文章。

先说个题外话,昨天文章 解除网页查看限制,自由查看和跳转网站 评论下有小伙伴问是否有插件可以直接打开新标签页,一般我用右键在新标签页打开链接,不过这样有点麻烦。

其实自己写个油猴脚本就可以了。

脚本内容如下,其实就一行代码,开启这个脚本后所有链接都会在新标签页打开。

代码语言:javascript
复制
// ==UserScript==
// @name         新标签打开网页
// @namespace    http://tampermonkey.net/
// @version      0.1
// @description  新标签打开网页
// @author       苏生不惑
// @match        *://*/*
// @grant        none
// ==/UserScript==

(function() {
    'use strict';
    document.querySelectorAll("a").forEach(function(item,index,arr){item.target='_blank';});
})();

另外文章里分享了安装Chrome扩展即可复制百度文库上的文字,后台有小伙伴问能不能下载百度文库,于是这里再做个整理。

小叶文档下载器

这个软件(公众号后台回复文库获取该软件)支持百度文库/豆丁/道客/新浪爱问/淘豆/帮帮文库/蚂蚁文库等文档的下载, 支持PDF和Word格式输出,同时支持OCR文字识别 (如果需要提取文字) 。

输入百度文库地址 https://wenku.baidu.com/view/021014797dd184254b35eefdc8d376eeaeaa172f.html ,下载的文件在当前自录下的download目录。

打开下载的PDF没问题。

再来下载豆丁文档 https://www.docin.com/p-513589737.html ,这个是Word格式。

还有道客巴巴文档 https://www.doc88.com/p-9029134991389.html

冰点文库

这个软件运行很久了(公众号后台回复文库获取该软件),无需积分就可以自由下载百度/豆丁/丁香/MBALib/Book118等文库文档(付费文档也支持)。

会同时下载 PDF和txt格式文件。

豆丁文档也一样(其他网站就不一一测试了)。

如果你使用的Mac系统,上面的Windows软件就没法用了,推荐下面的Chrome扩展和油猴脚本。

Chrome扩展

比如这个百度文库https://wenku.baidu.com/view/021014797dd184254b35eefdc8d376eeaeaa172f.html 剩余3页不能看。

安装 https://github.com/wxbool/baidu-wenku 这个Chrome扩展后右侧多了清理dom和导出文档按钮。

点击清理dom会自动运行。

清理完成后页面上只剩下文档。

点击导出文档会调用谷歌浏览器的另存为PDF,保存即可。

如果想将下载后的 PDF 文档转换为 Word 文档格式推荐之前文章 良心整理:PDF工具合集分享的软件 pdfsharper

提取文本也很方便。

油猴脚本

https://greasyfork.org/zh-CN/scripts/405373 这个脚本会将百度文库内文章中的文本内容转换为 word 并下载,关于油猴脚本的安装使用见之前文章 实用油猴脚本推荐,让你的谷歌浏览器更强大

下载的Word文件没问题。

最后分享个下载豆丁文档的网站 https://www.docin365.com/ , 这个网站是豆丁网文档复制抓取工具,导出的文档为word形式,非源文件,但文字可编辑,包含图片,尽量保持原文档的格式。

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 苏生不惑 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 小叶文档下载器
  • 冰点文库
  • Chrome扩展
  • 油猴脚本
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档