Java正则表达式的十大问题(上)

本文总结了关于Java正则表达式的常见问题。

由于它们是最常用的,你可能会发现它们也非常有用。

1. 如何从字符串中提取数字?

使用正则表达式的一个常见问题是将所有数字提取到整数数组中。

在Java中,\d表示数字范围(0-9)。

尽可能使用预定义的类将使你的代码更易于阅读,并消除由畸形字符类引入的错误。

有关详细信息,请参阅预定义的字符类。

请注意\d中的第一个反斜杠。

如果在字符串文字中使用转义结构,则必须在反斜杠前面加上另一个反斜杠,以便编译字符串。

这就是为什么我们需要用\\d。

2. 如何用换行符拆分Java字符串?

根据所使用的操作系统,至少有三种不同的方式可以输入新行字符。

因此,按新行分割字符串最直接的方法是:

但是如果你不想要空行,你可以使用,这也是我最喜欢的方法:

下面是一种更高级的方法,它实际上是独立于系统的。但是请记住,如果两个换行符并排放置,仍然会得到空行。

3.pattern.compile()的重要性

指定为字符串的正则表达式必须首先编译为Pattern类的实例。

编译()方法是创建对象实例的唯一方法。

典型的调用序列是这样的:

本质上,Pattern.compile()用于将正则表达式转换为有限状态机(参见编译器:原理、技术和工具(第二版))。

但是执行匹配所涉及的所有状态都驻留在匹配器中。

通过这种方式,可以重用模式p。

许多牌手可以共享相同的模式。

pattern.matches()方法被定义为当正则表达式只使用一次时的便利方法。此方法仍然使用compile()隐式获取模式的实例,并与字符串匹配。

与上面的第一个代码相同,但是对于重复匹配,它的效率较低,因为它不允许重用已编译的模式。

4. 如何转义文本为正则表达式?

通常,正则表达式使用“\”来转义结构,但是在反斜杠前面加上另一个要编译的Java字符串是很痛苦的。

用户还可以通过另一种方式将字符串文本传递给模式,比如“$5”。不用写\\$5或[$]5,我们可以打字。

5. 为什么String.split()需要转义管道分隔符?

split()在给定正则表达式的匹配项周围拆分字符串。

Java表达式支持影响模式匹配方式的特殊字符,这称为元字符。

|是一个元字符,用于从多个可能的正则表达式中匹配单个正则表达式。

例如,|b的意思是A或B。有关详细信息,请参阅与竖条或管道符号的交替。

因此,要使用|作为文字,你需要通过在它前面添加\\|来转义它。

图文来源:网络

如有侵权请联系作者删除

-END-

六步教你学会用Java生成二维码

系统水印不好看?那就自己开发吧

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190123A13URA00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券