首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何用 Python 爬取网页制作电子书

因此,我们要告诉回调函数它处理章节的顺序号,我们要给回调函数传参,修改后的代码是这样的: 不知道大家注意到没有,前面的分析目录已经提供了一个data_rid可以作为排序号,我们目录分析页面获取这个序号...parse_chapter通过 response 的 meta 获取传入的参数,然后文件名中加入这个顺序好完成了排序。...3.2 ePub 电子书简介 ePub(Electronic Publication 的缩写,意为:电子出版),是一个自由的开放标准,属于一种可以 “自动重新编排” 的内容;也就是文字内容可以根据阅读设备的特性...3.3 加载 html 文件 要制作 ePub 电子书,我们首先通过 Sigil 把我们的抓取的文件加载到程序添加文件对话框我们全选所有文件: 内容都是 HTML 文件,所以编辑、排版什么的学习下...3.6 编辑元数据 编辑书名、作者等信息: 3.6 输出 ePub 编辑完成后保存,取个名字: 输出可以使用电子书阅读软件打开查看,我用的是 Calibre,还可以方便的转换为相应的格式装到 Kindle

2.4K110

用 Markdown 写一本自己的电子书吧(一)手动篇

然后现有目录结构创建 mimetype, META-INF/container.xml 和 EPUB/package.opf 文件: example ├── EPUB │ └── package.opf...其中 package.opf ,我们 package > metadata 内定义了一些 .epub 必备的元信息。...此时,如果将 example 目录的内容进行 zip 打包,生成文件名称改为 example.epub,就已经可以一些 epub 阅读器中正常打开进行阅读了。...toc.xhtml 内的 nav 导航目录,支持 ol > li > ol > li ... 嵌套实现多级目录。 部分阅读器不支持 nav 导航目录使用 ul 无须列表。...如果基于文件名进行排序,相当于引入了一套不可控的潜规则,对于书籍迁移、页面删减维护都不太方便。而且如果需要处理导航目录内隐藏、重新引用的场景,还要引入更复杂的潜规则。

1.2K30
您找到你想要的搜索结果了吗?
是的
没有找到

gitbook 入门教程之导出电子书 原

gitbook 既可以将源码文件单独输出,也可以仅输出单个文件,常见的导出电子书格式主要有三种(ePub, Mobi, PDF),而这三种格式都依赖于系统本身提供的 ebook-convert 工具....配置封面 所有格式的电子书都可以配置自定义封面,项目的根目录下提供 cover.jpg 和 cover_small.jpg 两种封面图片时,生成电子书会自动增加封面页....当然你也可以使用 autocover 插件 自动生成封面,不过本人才疏学浅,几经尝试始终没有成功,如果有人成功了记得给我留言下哈!.../myBook.pdf --log=debug # 生成 `epub` 文件并输出 `debug` 级别日志 $ gitbook epub ./ ....生成 ePub 文件 示例: $ gitbook epub 默认在当前项目的根目录下生成 book.epub 文件名,如果配有封面,则首页显示封面,否则无封面. ?

2.5K10

R沟通|Bookdown中文书稿写作手册(

书的输出格式包括支持gitbook格式的网页图书, 也可以经 LATEX 编译器转换的PDF图书,还可以生成ePub等格式的电子书。...该目录的所有的文本文件都要使用UTF-8编码。 2.3.1 index.Rmd文件 一本bookdown书, 一般都需要有一个index.Rmd文件, 这是最后生成的网站的主页的原始文件....style.css是自定义的 CSS 显示格式,gitbook和epub_book中使用; _header.html是插入了一部分个性化的HTML代码,其内容将出现在每个生成的HTML文件的head部分...我们也可以用其他浏览器(建议使用 Google chrome 浏览器)打开_book子目录的index.html文件来查看gitbook格式的图书。...可以_book子目录中找到这个PDF文件。 对于epub_book格式,如果成功编译,会在操作系统默认的ePub软件(如苹果电脑的book)打开,并在_book子目录中找到这个ePub文件。

2.8K10

使用Gitbook制作发布个人的电子书籍

使用gitbook serve启动服务: gitbook serve 然后根据终端的提示,浏览器打开http://localhost:4000查看书籍 https://app.gitbook.com...如果你想查看输出目录详细的记录,可使用gitbook build ./ --log=debug --debug来构建查看。 8....生成电子书(报错暂时不操作) GitBook 可以生成一个网站,但也可以输出内容作为电子书(ePub,Mobi,PDF)。...配置文件写完后,需要重启服务或者重新打包才能应用配置。 gitbook的配置文件名是book.json,首先在项目的根目录创建book.json文件。...比如侧边栏菜单显示标题数字,可以配置文件的pluginsConfig参数写入如下字段: { "pluginsConfig": { "theme-default": {

1.7K30

使用Gitbook创建文档并导出PDF

导出PDF的方式有很多种,之前使用过马克飞象的导出功能,不过只是简单的导出并不能添加目录,因为源文件是markdown编写的,经过筛选后采用了gitbook的方式进行编写文档并且使用gitbook pdf...配置语言 gitbook默认使用的并不是中文汉子,我们需要通过配置book.json文件来修改默认语言方式(book.json文件创建在SUMMARY.md同级目录下)如下所示: { "language...导出为PDF SUMMARY.md文件的同级目录执行gitbook pdf .命令进行导出PDF文件,执行日志如下所示: ➜ gitbook-example gitbook pdf . info: 7...导出为epub SUMMARY.md文件的同级目录执行gitbook epub .命令进行导出epub文件,执行日志如下所示: ➜ gitbook-example gitbook epub . info...info: >> 1 file(s) generated 导出日志查看 如果你导出过程遇到了问题,你可以执行导出命令时添加--log=debug命令参数,这样导出时就可以看到完整的日志信息控制台输出

2.3K10

用 Markdown 写一本自己的电子书吧(二)自动篇

入口 项目的入口文件 index.js ,我们约定传入的第一个参数为需要处理的电子书目录,其中存在对应 book.json 配置: // index.js import fs from 'fs/promises...所以我们在这里做个小优化,把上面字符串模板的内容提取到 templates/EPUB/package.opf.xml 文件内,然后再重新实现一个 render 函数: 通过传入模板名字 templateName...除了 package.opf 之外,之前的 mimetype 和 META-INF/container.xml 文件也可以提取为模板目录 templates 内的文件,整个流程传入对应名字就能完成它们的渲染了...所以我们项目里创建一个 Task 任务类,每次任务就创建一个它的实例负责处理。在任务过程,它会有一个属于自己的临时目录保存过程的中间文件,可以自己的实例变量缓存的资源信息。...'linear="no"' : '' }/>` ).join('')} 最后 Task.run() ,将任务目录打包为 .epub 文件并在完成后清理任务目录

1.8K10

如何在 Fedora 上生成 EPUB 电子书

这篇文章展示了使用两种不同的方法来创建一个 EPUB 文件。EPUB 格式是最流行的格式之一,并且被很多开源软件所支持。...如果你有子章节,使用“标题 3”(###)。 image.png 在你的文档完成后,单击“文件 -> 导出”(或按 Ctrl+E 键)。在对话框几个 Markdown 转换器中进行选择。...如果这是你第一次使用 ghostwriter ,默认选择的是 Sundown 转换器。从对话框,选择 pandoc 。接下来单击“导出”。现在你的 EPUB 文件已经创建好了。...你可以从软件中心安装它,也可以从终端安装它: sudo dnf install calibre 在这个方法,你可以 LibreOffice、ghostwriter,或者其它你选择的编辑器编写你的文档...接下来,告诉 calibre 包含内容目录。选择 “输出 EPUB” 部分并勾选 “插入内联目录”。单击“确定“ 创建 epub 文件。

89210

GitBook + Typora + Git 编写电子文档

重新使用gitbook根据目录,初始化篇章 然后我们回到命令行, mybook 文件夹再次执行 gitbook init 命令。...GitBook 会查找 SUMMARY.md 文件描述的目录和文件,如果没有则会将其创建。 ? Typora 是所见即所得(实时渲染)的 Markdown 编辑器,这时候它是这样的: ?...构建书籍 当你写得差不多,你可以执行gitbook build命令构建书籍,默认将生成的静态网站输出到_book目录。...如果要升级nvm 如果要升级的话,请重新下载最新的安装程序。并直接运行安装程序。它将安全的覆盖需要更新的文件,而无需关心nodejs的安装。 此次安装需要确保和上次使用相同的安装目录。...或者 Typora 安装 Pandoc 进行导出。 除此之外,别忘了还可以用 Git 做版本管理呀!

3.5K20

使用.NET设计一个Epub电子书生成工具

作为一个喜欢看小说的人,我收藏了很多小说,但是寻找 Epub 电子书生成工具时,没有找到满意的类库,因此决定自己开发一个 .NET 类库工具,用于制作 Epub 电子书。...设计思路与核心代码 设计之前我们需要知道 Epub 格式的本质,Epub 格式其实就是按照一定规则生成的一个小型网站,含有书籍的目录和内容等其他信息,然后将这些整个网页文件打包为 ZIP 压缩格式。...在这个方法,我们使用了 System.IO.Compression 命名空间下的 ZipArchive 类来创建一个 Epub 电子书文件,因为 Epub 电子书实际上是一个特殊格式的 ZIP 文件。...这些文件的具体格式和内容可以 Epub 规范中找到。...添加这些文件时,我们使用了 StringBuilder 类来拼接字符串,并通过 Encoding.UTF8.GetBytes 方法将字符串转换为字节数组,然后将字节数组写入到相应的文件

34020

用 Sigil Linux 上创建和编辑 EPUB 文件

你可以使用 Sigil 创建一个新的 EPUB 格式的电子书,或编辑现有的 EPUB 电子书(以 .epub 扩展结尾的文件)。...Sigil 只专注于 EPUB 书籍,它有以下功能: 支持 EPUB 2 和 EPUB 3(有一定的限制) 提供代码视图预览 编辑 EPUB 语法 带有多级标题的目录生成器 编辑元数据 拼写检查 支持正则查找和替换...出于这个原因,你应该使用一些其他 开源写作工具,以 epub 格式导出你的文件(如果可能的话),然后 Sigil 编辑它。...只要在你的发行版的软件中心应用寻找它就可以了。 image.png 你可能需要事先启用 universe 仓库。...你也可以 Ubuntu发行版中使用 apt 命令: sudo apt install sigil Sigil 有很多对 Python 库和模块的依赖,因此它下载和安装了大量的包。

3.2K10

Windwos 安装Pandoc 工具,实现Typora 文档导出为docx

就如同我们Typora中将图片自动导入到远程的图床时使用PicGo软件一样。 Pandoc也是一个独立的软件,Typora可以直接调用系统安装的Pandoc来实现word文档的导出而已。...Pandoc还可以通过LaTeX、Groff ms或HTML生成PDF输出。 上面只是介绍了部分转换,更详细的可以通过Pandoc官网介绍进行了解和查询。 2....安装完毕后出现的成功界面如下: 在这个结束界面,已经说明了我们的Pandoc安装到了C:\Program Files\Pandoc 目录下。...Typora 添加Pandoc 当我们本地安装好Pandoc之后,就可以将路径配置到Typora,这样Typora进行导出为word文档时,就会自动调用相关的转换命令,将我们的markdown文档转换为...Pandoc安装目录

2.7K20

5 个用命令行操作 LibreOffice 的技巧

例如,Seth Kenlon 最近解释了如何使用 LibreOffice 用全局 命令行选项将多个文件 从 DOCX 转换为 EPUB。...查看 LibreOffice 命令的一些隐藏功能之前,你需要了解如何使用应用选项。并不是所有的应用都接受选项(除了像 --help 选项这样的基本选项,它在大多数 Linux 应用中都可以使用)。...例如, LibreOffic ,将一个文档转换为 EPUB 是一个非常简单的任务,但使用 libreoffice 命令就更容易: $ libreoffice --headless --convert-to...epub example.odt 使用通配符意味着你可以一次转换几十个文档: $ libreoffice --headless --convert-to epub *.odt 你可以将文件转换为多种格式...要打印一个目录的所有文件: $ libreoffice -p *.odt (我不止一次执行了这个命令,然后用完了纸,所以在你开始之前,确保你的打印机里有足够的纸张。) 你也可以把文件输出成 PDF。

2.4K30

代码之丑

2.3 错误的拼写// 单词排序class QuerySort { SortFiled sortFiled;     ...}问题:排序字段,应该sortField。...优化:将打印日志和上报逻辑放在SendMessage函数。建议:识别相似的结构。警惕:异常处理、上报等,以及当你使用ctrl+v时。...建议:1、将参数列表封装成对象,支付常见的就是proto文件定义Message而不是平铺;2、动静分离,原本应该属于静态结构的部分却以动态参数的方式传来传去,无形之中拉长了参数列表,举例说明如下:...…… HttpClient http_client = XXX; httpClient.execute(); } 3、告别标记,不要用标记(布尔值、枚举值等形式很多)控制路径,重构这种手法叫做移除标记参数...return price * 0.95; case UserLevel::GOLD: return price * 0.85;   }}问题:用户实际支付的价格会根据用户系统的用户级别有所差异

63741

探索 Flow:全新的在线 EPUB 阅读体验

想象一下,电脑前工作时,你可以 Flow 打开一本专业书籍;晚上沙发上放松时,通过手机继续阅读同一本书籍,而且所有的阅读进度和笔记都能同步更新。...渐进式网络应用(PWA) Flow 是一个渐进式网络应用,这意味着你可以在任何支持现代 Web 技术的浏览器上使用它,而且它还支持离线使用。...当你的设备重新联网时,Flow 会自动更新,确保你总是使用最新版本的应用。 网格布局:一次阅读多本书 Flow 的独特之处在于它的网格布局功能,这让你能够同一时间阅读多本书籍。...无论是工作还是学习,这个功能都能帮助你提高效率,同时处理多个阅读材料。...这样,无论你更换了设备还是重新安装了 Flow,你的阅读资料都不会丢失。 结语 Flow 以其强大的功能、跨平台的兼容性和用户友好的设计,为 EPUB 阅读带来了全新的体验。

44110

7 个最佳 Linux 电子书阅读器

本文中,我们选出了七个最佳 Linux 电子书阅读器。这些电子书阅读器最适合 pdf、epub 和其他电子书格式。 我提供的是 Ubuntu 安装说明,因为我现在使用它。...支持将书籍存储 Google Drive ,可以通过作者,系列或其他属性整理书籍。 安装 你能从官方库或者终端输入以下命令安装 FBReader 电子阅读器。...备注:查看这个应用的时候,我发现这个应用在 Ubuntu 和它的衍生系统不支持 ePub 文件格式。其他发行版用户仍然可以发挥它全部的潜力。...Lucidor Lucidor 是一个易用的、支持 epub 文件格式和在 OPDS 格式编目的电子阅读器。...当然,Bookworm 看起来很有前途,这几天我经常使用它。不过,电子书应用的选择完全取决于你的喜好。 你使用哪个电子书应用呢?在下面的评论让我们知道。

4.8K21

用Sphinx快速制作文档

下面列出了其良好特性,这些特性Python官方文档均有体现: 丰富的输出格式: 支持 HTML (包括 Windows 帮助文档), LaTeX (可以打印PDF版本), manual pages(...我们需要在终端输入下列命令进行安装: pip install sphinx 创建Sphinx项目 创建一个用于存放文档的文件夹,然后该文件夹路径下运行下列命令快速生成Sphinx项目: sphinx-quickstart...输出(一般用不到,回车默认不开启即可) 12Sphinx can also add configuration for epub output:> Do you want to use the epub...注:文档文件放在与index.rst同级目录下。 支持markdown文件、更改文档主题 Spinx本身不支持.md文件生成文档,需要我们使用第三方库recommonmark进行转换。...pip install recommonmark pip install sphinx_rtd_theme 安装好,conf.py修改下列两个配置: source_suffix = ['.rst'

1.8K61

使用 Linux 实用程序 gPhoto2 备份手机存储

如果你没有列表中找到自己的移动设备,你仍然可以尝试使用 gphoto2,可能你的设备列表中使用了不同的称呼。...你可以使用许多不同的选项,具体取决于你想从设备获取什么。...例如,假设有一个名为 example.epub 的文件在当前目录,你可以使用 --upload-file 选项和 --folder 选项将文件发送到设备并指定要上传到的目录: $ gphoto2 --...upload file example.epub \ --folder store_00010001 如果你希望将多个文件上传到同一个位置,你可以设备上创建一个目录: $ gphoto2 --mkdir...探索你的使用方式 gPhoto2 的大部分功能取决于你的设备,因此不同用户的体验可能不尽相同。 gphoto2 --help 列出了许多操作供你探索。

69320
领券