java过滤掉字符串中的html标签、style标签、script标签

import java.util.regex.Matcher;
import java.util.regex.Pattern; 

public class HTMLSpirit{ 
  public static String delHTMLTag(String htmlStr){ 
    String regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式 
    String regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式 
    String regEx_html="<[^>]+>"; //定义HTML标签的正则表达式 
     
    Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); 
    Matcher m_script=p_script.matcher(htmlStr); 
    htmlStr=m_script.replaceAll(""); //过滤 
     
    Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE); 
    Matcher m_style=p_style.matcher(htmlStr); 
    htmlStr=m_style.replaceAll(""); //过滤style标签 
     
    Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE); 
    Matcher m_html=p_html.matcher(htmlStr); 
    htmlStr=m_html.replaceAll(""); //过滤html标签 

    return htmlStr.trim(); //返回文本字符串 
  } 
  public static String delSpace(String htmlStr){ 
    htmlStr = htmlStr.replaceAll("\n", "");
    htmlStr = htmlStr.replaceAll("\t", "");
    return htmlStr.trim(); //返回文本字符串 
  }
} 

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏猿人谷

出栈顺序

之前参加过华北计算机研究所和优酷土豆的笔试,都考到出栈顺序,之前数据结构学的不到位,遇到这类题时,还着实把我愣了一会,现在总结下,省得以后再遇到这类问题,也希...

3366
来自专栏后端之路

Collections Arrays你会用么?

背景 JDK给我们提供了一些工具类 用来操作集合等。 通常来说命名规则就是XXXXs 比如Collections 比如Arrays 看到部分同学使用如下 ? ?...

2389
来自专栏你不就像风一样

Java过滤掉字符串中的html标签、style标签、script标签

932
来自专栏你不就像风一样

Java多线程核心技术(五)单例模式与多线程

什么是立即加载?立即加载就是使用类的时候已经将对象创建完毕,常见的实现办法就是直接 new 实例化。

683
来自专栏calmound

Javascript DOM操作实例

      最近在学DOM,但是还是没有办法很好的记住API,想找些例子来练习,网上的例子将一个个DOM对象方法挨个举例,并没有集合在一起用,效果不尽人意。所以...

2463
来自专栏流媒体

Prototype模式简介

用于创建重复的对象,同时又能保证性能。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式。这种模式是实现了一个原型接口,该接口用于创建当前对象的克...

691
来自专栏行者常至

009.多线程-AtomicInteger

版权声明:本文为博主原创文章,允许转载,请标明出处。

662
来自专栏云霄雨霁

数据结构----栈

1530
来自专栏王硕

原 对于PostgreSQL中Datum的解释

34910
来自专栏java闲聊

JDK1.8 LinkedList 源码解析

1964

扫码关注云+社区

领取腾讯云代金券