首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

删除链接以外的所有HTML标记

要删除HTML标记以外的所有内容,可以使用正则表达式。以下是一个Python示例,演示如何使用正则表达式删除HTML标记以外的所有内容:

代码语言:python
复制
import re

def remove_html_tags(text):
    clean = re.compile('<.*?>')
    return re.sub(clean, '', text)

html_text = '<html><head<title>Title</title></head><body><p>This is a paragraph.</p></body></html>'
text_only = remove_html_tags(html_text)

print(text_only)

输出结果:

代码语言:txt
复制
TitleThis is a paragraph.

这个示例中,我们定义了一个名为remove_html_tags的函数,它接受一个包含HTML标记的字符串,并返回一个不包含HTML标记的字符串。我们使用正则表达式<.*?>来匹配HTML标记,并使用re.sub()函数将其替换为空字符串。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券