前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandoc快速转换Word到Markdown文件

Pandoc快速转换Word到Markdown文件

作者头像
糖果
发布2023-03-05 10:58:03
1.7K0
发布2023-03-05 10:58:03
举报
文章被收录于专栏:糖果的实验室糖果的实验室

Pandoc是一款非常强大的文档格式转换工具,对于Word转Markdown的场景,可以快速的实现转换,并且把Word文件中图片,生成到指定的文件夹中。

Pandoc是由John MacFarlane开发的标记语言转换工具,可实现不同标记语言间的格式转换,堪称该领域中的“瑞士军刀”。

Pandoc understands a number of useful markdown syntax extensions, including document metadata (title, author, date); footnotes; tables; definition lists; superscript and subscript; strikeout; enhanced ordered lists (start number and numbering style are significant); running example lists; delimited code blocks with syntax highlighting; smart quotes, dashes, and ellipses; markdown inside HTML blocks; and inline LaTeX. If strict markdown compatibility is desired, all of these extensions can be turned off.

上面是引用的,关于Pandoc的介绍。

代码语言:javascript
复制
pandoc -f docx -t markdown test.docx -o test.md --extract-media ./images

Word文档中的图片

Word文档

转换后的Markdown文件

Pandoc还支持,直接通过Http协议访问网页的内容,并生成Markdown文件,远端Web服务器上的图片也可以,保存到本地的图片文件夹中。

代码语言:javascript
复制
pandoc -f html -t markdown --request-header User-Agent:“Mozilla/5.0” https://candylab.net/design/HFishSOC/ -o candylab.md --extract-media ./images1

网站上的HTML

保存到本地的Markdonwn文件

方便的地方在于,Word中和图片和网站上的图片,统一保存到指定文件夹中。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 糖果的实验室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档