前言:今天先分享正则表达式的基础元字符,后续会分享正则表达式的子表达式,回溯引用,前后查找,嵌入条件,,全部分享完成之后,会尝试着去分享一些例子与拆分介绍。如果文字描述有问题可以评论指出,如果概念很模糊,可以加我微信,我会尽量解答你的疑惑。
一
正则表达式的定义
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
二
正则表达式的字符区间
[]这个元符号可以定义一个字符集合,字符集合能够与在该集合里的字符区间的字符相匹配。字符区间可以使用 - 连字符来定义范围。
三
正则表达式取非
四
正则表达式的空白元字符
注:\r\n是windows使用的文本行结束标签,\n是unix/linux的文本行结束标签
五
正则表达式的其他元字符
六
正则表达式匹配字符
七
正则表达式的贪婪型字符与懒惰型字符
* + 为贪婪性元字符,在进行匹配时,行为模式是多多益善而不是适可而止的,会尽可能的从一段文本的开头一直匹配到文本的末尾,而不是从这段文本的开头匹配到碰到的第一个匹配是为止。
懒惰型字符相反。
贪婪型字符 | 懒惰型字符 |
---|---|
* | *? |
+ | +? |
{n,} | {n,}? |
八
正则表达式边界字符
\w相匹配的字符叫做单词边界,\W相匹配的叫做非单词边界
\b单词边界字符,例如:至匹配 at 而不匹配 what,可以使用 --\bat\b
\B匹配一个前后都不是单词边界的连字符(-),nine-digit不能匹配,color - coded的连字符(-)可以匹配