前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >正则表达式-1.字符匹配

正则表达式-1.字符匹配

作者头像
悠扬前奏
发布2019-05-28 12:35:21
1.2K0
发布2019-05-28 12:35:21
举报
文章被收录于专栏:悠扬前奏的博客

1. 匹配单个字符

1.1 匹配纯文本

在原始文本中查找目标文本

代码语言:javascript
复制
/as/.test("asd"); // true
/ad/.test("asd"); // false
多个匹配结果

一般正则表达式默认匹配第一个结果,提供不同的匹配模式供选择。

代码语言:javascript
复制
"asdasd".match(/as/g); // ["as", "as"]
大小写

一般正则表达式会提供一个机制,选择区分或者不区分大小写。

代码语言:javascript
复制
/A/.test("asd"); // false
/A/i.test("asd"); // true

1.2 匹配任意字符

点号(.)可以匹配任何一个单个字符。

代码语言:javascript
复制
/a.d/.test("asd"); // true
/a.d/.test("afd"); // true

1.3 匹配特殊字符

对于点号,星号等在正则表达式中有特殊含义的字符,需要在前面加一个反斜杠(\)来进行转移。

“\“本身就是”\“

代码语言:javascript
复制
/a\.d/.test("asd"); // false
/a\.d/.test("a.d"); // true

2.匹配一组字符

字符集合用来匹配特定的字符和字符区间。

2.1 匹配一组字符中的一个

用中括号([])来定义字符集合,中括号间的字符都是该集合的组成部分,字符集和的匹配结果是能够和集合中的任意一个成员相匹配的文本。

代码语言:javascript
复制
/[abc]/.test("asd"); // true
/[abc]/.test("qsd"); // /false

2.2 字符集合区间

用连字符(-)来定义字符区间。

代码语言:javascript
复制
/[0-9]a/.test("2a"); // true
/[a-z]a/.test("aa"); // true

字符区间的首尾字符可以使ASCⅡ字符表里的任意字符,且匹配是按照字符表编码的决定的。需要注意连字符两边的字符顺序。

代码语言:javascript
复制
/[9-1]a/.test("2a"); // error

连字符只在中括号之间有效,在其他地方作为普通字符,不需要加反斜杠。

代码语言:javascript
复制
/-[a-z]/.test("-a"); // true

2.3 取非匹配

用元字符^对一个字符集合进行取非操作。即匹配字符集合以外的字符。

代码语言:javascript
复制
/[^a-z]/.test("asd"); // fasle

注意:虽然^放在方括号里面,但是是作用于整个字符区间的。

3. 元字符匹配

3.1 匹配元字符自身

用反斜杠(\)转义。

代码语言:javascript
复制
/\./.test("."); // true

3.2 匹配空白字符

正则表达式中用来表示空白字符的元字符如下:

元字符

说明

\b

回退

\f

换页符

\n

换行符

\r

回车符

\t

制表符

\v

垂直制表符

注意:不同操作系统中对于文本行结束,文本结束的表示不同。例如,在Windows用\r\n表示文本行结束。Unix和Linxu系统用一个换行符来结束文本行。

3.3 匹配特定字符类型

3.3.1 匹配数字,非数字

元字符

说明

\d

任何一个数字字符(等价于0-9)

\D

任何一个非数字字符(等价于^0-9)

代码语言:javascript
复制
/\d/.test("1") ; // true
/\D/.test("1") ; // false

可以看到用小写d匹配数字,大写D匹配相反的非数字,后面的其他类元字符也是如此。

3.3.2 匹配字母、数字和下划线,非字母、数字和下划线

元字符

说明

\w

任何一个字母,数字,下划线(等价于a-zA-Z0-9_)

\W

任何一个非字母,数字,下划线(等价于^a-zA-Z0-9_)

代码语言:javascript
复制
/\w/.test("a"); \\ true
/\W/.test("a"); \\ false

3.3.3 匹配空白字符,非空白字符

元字符

说明

\s

任何一个空白字符(等价于\f\n\r\t\v)

\S

任何一个非空白字符(等价于^\f\n\r\t\v)

代码语言:javascript
复制
/\s/.test(" "); // true
/\S/.test("a"); // true

注意:退格字符\b元字符不在类元字符\s的覆盖范围内。

3.3.4 匹配十六进制或者八进制数值

1. 使用十六进制匹配

正则表达式中用前缀\x来表示十六进制数值。

例如,\x0A对应于ASCⅡ字符10(换行符),等价于\n 。

2.使用八进制匹配

正则表达式用用前缀\0表示八进制数值。

例如,\011表示ASCⅡ字符9(制表符),等价于\t。

3.4 POSIX字符类

很多语言的正则表达式支持POSIX表达式。

注意:JavaScript不支持。

字符类

说明

:alnum:

任何一个字母或数字(等价于a-zA-Z0-9)

:alpha:

任何一个字母(等价于a-zA-Z)

:blank:

空格或者制表符(等价于 \t)

:cntrl:

ASCⅡ控制字符(ASCⅡ0到31,再加上ASCⅡ127

:digit:

任何一个数字(等价于0-9)

:graph:

任何一个可打印字符,不包括空格

:lower:

任何一个小写字母(等价于a-z)

:print:

任何一个可打印字符

:punct:

既不属于:alnum:也不属于:cntrl:的任何一个字符

:space:

任何一个空白字符,包括空格(等价于 \t\r\n\v\f)

:upper:

任何一个大写字母(等价于A-Z)

:xdigit:

任何一个十六进制数字(等价于a-fA-F0-9)

下一篇:重复匹配

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017.12.15 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 匹配单个字符
    • 1.1 匹配纯文本
      • 1.2 匹配任意字符
        • 1.3 匹配特殊字符
        • 2.匹配一组字符
          • 2.1 匹配一组字符中的一个
            • 2.2 字符集合区间
              • 2.3 取非匹配
              • 3. 元字符匹配
                • 3.1 匹配元字符自身
                  • 3.2 匹配空白字符
                    • 3.3 匹配特定字符类型
                      • 3.3.1 匹配数字,非数字
                      • 3.3.2 匹配字母、数字和下划线,非字母、数字和下划线
                      • 3.3.3 匹配空白字符,非空白字符
                      • 3.3.4 匹配十六进制或者八进制数值
                      • 3.4 POSIX字符类
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档