首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何删除除粗体、斜体、下划线和换行符以外的所有html标记?

如何删除除粗体、斜体、下划线和换行符以外的所有html标记?
EN

Stack Overflow用户
提问于 2012-07-06 23:07:47
回答 4查看 2K关注 0票数 0

我对正则表达式不是很在行,所以我正在寻求帮助。

我想知道什么是删除除以下所有html标签的正则表达式。

  1. Bold
  2. Italic
  3. Underline
  4. New线路

谢谢你们。希望你能在这件事上帮我。

EN

回答 4

Stack Overflow用户

发布于 2012-07-06 23:15:00

将正则表达式替换为空字符串<[]>.*?</[]>并收集到[]中所有包含标记,例如<[mas]>.*?</[mas]> capture <m>anything</m> <a>anything</a> <s>anything</s>

票数 1
EN

Stack Overflow用户

发布于 2012-07-06 23:16:29

笑话除了this,不要试图用正则表达式解析超文本标记语言,使用超文本标记语言解析器。它会让你的生活变得轻松。

谷歌或搜索在这里关于"HTML解析器“+您选择的语言。

票数 1
EN

Stack Overflow用户

发布于 2015-02-12 17:34:53

我不确定为什么其他答案认为您需要解析HTML。您只需要替换一些模式,而不是其他模式。所以你使用一个回调函数来替换正则表达式...

代码语言:javascript
复制
var keep = {
    b: true,
    i: true,
    u: true,
    br: true
};

html.replace(/<\/?([a-z]+) ?[^>]*>/g, function(wholeMatch, tagName)
{
    if (keep[tagName]) {
        return wholeMatch;
    }

    return '';
});
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11364848

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档