首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >html2text:将 HTML 转换为 Markdown 格式文本

html2text:将 HTML 转换为 Markdown 格式文本

作者头像
周小董
发布2019-03-25 11:23:51
发布2019-03-25 11:23:51
3.9K00
代码可运行
举报
文章被收录于专栏:python前行者python前行者
运行总次数:0
代码可运行

文档:https://pypi.org/project/html2text/

安装:

代码语言:javascript
代码运行次数:0
运行
复制
pip install html2text

Option

Description

–version

Show program’s version number and exit

-h, –help

Show this help message and exit

–ignore-links

Don’t include any formatting for links

–escape-all

Escape all special characters. Output is less readable, but avoids corner case formatting issues.

–reference-links

Use reference links instead of links to create markdown

–mark-code

Mark preformatted and code blocks with [code]…[/code]

代码语言:javascript
代码运行次数:0
运行
复制
>>> import html2text
>>>
>>> print(html2text.html2text("<p><strong>Zed's</strong> dead baby, <em>Zed's</em> dead.</p>"))
**Zed's** dead baby, _Zed's_ dead.
代码语言:javascript
代码运行次数:0
运行
复制
>>> import html2text
>>>
>>> h = html2text.HTML2Text()
>>> # Ignore converting links from HTML
>>> h.ignore_links = True
>>> print h.handle("<p>Hello, <a href='http://earth.google.com/'>world</a>!")
Hello, world!

>>> print(h.handle("<p>Hello, <a href='http://earth.google.com/'>world</a>!"))

Hello, world!

>>> # Don't Ignore links anymore, I like links
>>> h.ignore_links = False
>>> print(h.handle("<p>Hello, <a href='http://earth.google.com/'>world</a>!"))
Hello, [world](http://earth.google.com/)!
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年08月06日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档