我使用pandoc转换epub文件为html,但我有问题的某些epub图书谁使用/images文件夹的图像和/或其他媒体。
示例:
pandoc -s --extract-media=bw_files bw.epub -o bw.html -M document-css=false
我会创建一个bw_files文件夹,其中包含提取的图像文件夹,但目标是将它们移动并将它们在输出的html文档中的位置更改为/,以便图像文件被正确引用。
发布于 2020-12-20 01:41:49
下面的电话可能会对您有所帮助:
pandoc -s --extract-media=. bw.epub -o bw.html -c my-style.css
请注意,示例中的子文件夹bw_files
将不会被创建。但是将提取.epub文件的结构。结果取决于.epub文件的内部结构。
有关更多信息,请查看Wikipedia EPUB。
发布于 2020-12-21 16:39:44
在转换过程中,图像会进入pandoc的"mediabag“。它们的文件名可以在那里修改,图像的链接也可以在那里修改。下面的Lua过滤器就是这样做的;将过滤器保存到一个文件中,然后通过--lua-filter
将该文件传递给pandoc。
local mediabag = require 'pandoc.mediabag'
-- Delete image files and re-insert under new name
for fp, mt, contents in mediabag.items() do
mediabag.delete(fp)
mediabag.insert(fp:gsub('images/', ''), mt, contents)
end
-- adjust path to image file
function Image (img)
img.src = img.src:gsub('images/', '')
return img
end
这是我在pandoc邮件列表上给出的答案的副本。
https://stackoverflow.com/questions/65363259
复制相似问题