首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >转义Java正则表达式中的特殊字符

转义Java正则表达式中的特殊字符
EN

Stack Overflow用户
提问于 2012-05-19 18:39:11
回答 4查看 125.7K关注 0票数 38

Java或任何开源库中是否有任何方法可以转义(而不是引号)特殊字符(元字符),以便将其用作正则表达式?

在动态构建正则表达式时,这将非常方便,而不必手动转义每个字符。

例如,考虑一个简单的正则表达式,如\d+\.\d+,它将数字与小数点匹配,如1.2,以及以下代码:

代码语言:javascript
复制
String digit = "d";
String point = ".";
String regex1 = "\\d+\\.\\d+";
String regex2 = Pattern.quote(digit + "+" + point + digit + "+");

Pattern numbers1 = Pattern.compile(regex1);
Pattern numbers2 = Pattern.compile(regex2);

System.out.println("Regex 1: " + regex1);

if (numbers1.matcher("1.2").matches()) {
    System.out.println("\tMatch");
} else {
    System.out.println("\tNo match");
}

System.out.println("Regex 2: " + regex2);

if (numbers2.matcher("1.2").matches()) {
    System.out.println("\tMatch");
} else {
    System.out.println("\tNo match");
}

毫不奇怪,上面的代码产生的输出是:

代码语言:javascript
复制
Regex 1: \d+\.\d+
    Match
Regex 2: \Qd+.d+\E
    No match

也就是说,regex1匹配1.2,但regex2 (“动态”构建)不匹配(相反,它匹配文字字符串d+.d+)。

那么,有没有一种方法可以自动转义每个正则表达式元字符?

假设在java.util.regex.Pattern中有一个静态escape()方法,那么

代码语言:javascript
复制
Pattern.escape('.')

将是字符串"\.",但是

代码语言:javascript
复制
Pattern.escape(',')

应该只生成",",因为它不是元字符。类似地,

代码语言:javascript
复制
Pattern.escape('d')

可以生成"\d",因为'd'用于表示数字(尽管在这种情况下转义可能没有意义,因为'd'可以表示文字'd',这不会被正则表达式插入器误解为其他内容,就像'.'的情况一样)。

EN

回答 4

Stack Overflow用户

发布于 2014-09-16 01:25:34

我写了这个模式:

代码语言:javascript
复制
Pattern SPECIAL_REGEX_CHARS = Pattern.compile("[{}()\\[\\].+*?^$\\\\|]");

并在下面的方法中使用它:

代码语言:javascript
复制
String escapeSpecialRegexChars(String str) {

    return SPECIAL_REGEX_CHARS.matcher(str).replaceAll("\\\\$0");
}

然后您可以像这样使用它,例如:

代码语言:javascript
复制
Pattern toSafePattern(String text)
{
    return Pattern.compile(".*" + escapeSpecialRegexChars(text) + ".*");
}

我们需要这样做,因为在转义之后,我们添加了一些正则表达式。如果没有,您可以简单地使用\Q\E

代码语言:javascript
复制
Pattern toSafePattern(String text)
{
    return Pattern.compile(".*\\Q" + text + "\\E.*")
}
票数 31
EN

Stack Overflow用户

发布于 2012-05-19 18:47:21

正则表达式匹配器知道您要查找的是数字而不是字母d的唯一方法是对字母(\d)进行转义。要在java中键入正则表达式转义字符,需要对其进行转义(这样\就变成了\\)。因此,没有办法为特殊的正则表达式字符键入双反斜杠。

票数 8
EN

Stack Overflow用户

发布于 2013-10-09 09:49:04

同意Gray的观点,因为您的模式可能需要同时包含字母([,])和元字符(,)。因此,使用某些实用程序,您应该能够首先转义所有字符,然后您可以在相同的模式中添加您想要添加的元字符。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10664434

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档