JavaScript正则表达式进阶指南

摘要:正则表达式是程序员的必备技能,想不想多学几招呢?

本文用JavaScript的exec方法来测试正则表达式。

例如,正则表达式/F.*g/会匹配“以F开头,以g结尾的字符串”,因此可以匹配"Hello, Fundebug!"中的Fundebug,exec方法会返回一个数组,其第一个元素为所匹配的子字符串。

/F.*g/.exec("Hello, Fundebug!")[0]
// 'Fundebug'

非贪婪匹配

默认情况下,正则表达式的量词*、+、?、{},都是进行贪婪匹配,即匹配尽可能多的字符

例如,正则表达式/.+s/匹配的是“以空格符结尾的字符串”,我们用它来匹配苹果公司创始人乔布斯在斯坦福大学演讲的名言“You time is limited, so don’t waste it living someone else’s life.”:

/.+\s/.exec("You time is limited, so don’t waste it living someone else’s life.")[0]
// 'You time is limited, so don’t waste it living someone else’s '

.可以匹配任意字符,而+表示匹配1次或者多次,且是贪婪的,因此/.+s/匹配到了最后一个空格符才结束。

当我们在量词*、+、?、{}后面紧跟着一个?,就可以实现非贪婪匹配,即匹配尽量少的字符

例如,正则表达式/.+?s/匹配到第一个空格符就会结束:

/.+?\s/.exec("You time is limited, so don’t waste it living someone else’s life.")[0]
// 'You '

正向肯定查找

使用正则表达式x(?=y),可以匹配'x'仅仅当'x'后面跟着'y'。这话有点绕,简单地说,就是匹配后面是y的x,这里的x和y都代表正则表达式。

例如,对于博客RabbitMQ入门教程的地址"https://blog.fundebug.com/2018/04/20/rabbitmq_tutorial/",如果需要匹配出域名fundebug的话,可以使用/[a-z]+(?=.com)/,匹配“在.com前面的英文单词”

/[a-z]+(?=\.com)/.exec("https://blog.fundebug.com/2018/04/20/rabbitmq_tutorial/")[0]
// 'fundebug'

广告:欢迎免费试用Fundebug,为您监控线上代码的BUG,提高用户体验~

正向否定查找

与正向肯定查找所对应的是正向否定查找,使用正则表达式x(?!y),可以"匹配'x'仅仅当'x'后面不跟着'y'"。

例如,小学生都知道的圆周率是3.1415926,不会的同学可以这样记“山顶上有一座寺庙,寺庙里面有一壶酒,还有一块肉”。如何匹配小数点后面的数字呢?可以使用/d+(?!\.)/,匹配"后面没有小数点的数字":

/\d+(?!\.)/.exec("3.1415926")[0]
// '1415926'

而使用之前提到的正向肯定查找,就可以匹配小数点前面的数字:

/\d+(?=\.)/.exec("3.1415926")[0]
// '3'

多行匹配

下面是鲍勃·迪伦的《Forever Young》歌词:

May God bless and keep you always,
may your wishes all come true,
may you always do for others
and let others do for you.
may you build a ladder to the stars
and climb on every rung,
may you stay forever young,
forever young, forever young,
May you stay forever young.

如何匹配以forever开头的那句歌词forever young, forever young呢?

这样写/^forever.+/是错误的:

/^forever.+/.exec("May God bless and keep you always,\nmay your wishes all come true,\nmay you always do for others\nand let others do for you.\nmay you build a ladder to the stars\nand climb on every rung,\nmay you stay forever young,\nforever young, forever young,\nMay you stay forever young.")
// null

为什么错了?因为^匹配的整个字符串的开始,而是不是每一行的开始。

正则表达式指定m选项,即可支持多行匹配,这时^$匹配的是每一行的开始和结束,因此正确的正则表达式是/^forever.+/m

/^forever.+/m.exec("May God bless and keep you always,\nmay your wishes all come true,\nmay you always do for others\nand let others do for you.\nmay you build a ladder to the stars\nand climb on every rung,\nmay you stay forever young,\nforever young, forever young,\nMay you stay forever young.")[0]
// 'forever young, forever young,'

捕获括号

在正则表达式中使用小括号(),可以提取出字符串中的特定子串。

例如,Fundebug是在2016年双11正式上线的,时间是"2016-11-11",如何提取其中的年、月、日呢?如下:

/(\d{4})-(\d{2})-(\d{2})/.exec("2016-11-11")
// [ '2016-11-11', '2016', '11', '11', index: 0, input: '2016-11-11' ]

可知,3个小括号中的正则表达式分别匹配的是年月日,其结果依次为exec返回数组中的1到3号元素。

参考

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT派

程序员必知的 Python 陷阱与缺陷列表

我个人对陷阱的定义是这样的:代码看起来可以工作,但不是以你“想当然”的方式。如果一段代码直接出错,抛出了异常,我不认为这是陷阱。比如,Python程序员应该都遇...

1194
来自专栏java一日一条

java中i=i++问题分析

程序的执行顺序是这样的:因为++在后面,所以先使用i,“使用”的含义就是i++这个表达式的值是0,但是并没有做赋值操作,它在整个语句的最后才做赋值,也就是说在做...

683
来自专栏我是业余自学C/C++的

各种编码

2543
来自专栏linux驱动个人学习

Android系统的智能指针(轻量级指针、强指针和弱指针)的实现原理分析【转】

Android系统的运行时库层代码是用C++来编写的,用C++ 来写代码最容易出错的地方就是指针了,一旦使用不当,轻则造成内存泄漏,重则造成系统崩溃。不过系统为...

992
来自专栏GopherCoder

专栏:003:正则表达式

2227
来自专栏专注 Java 基础分享

计算机编码基础

     乱码是我们在日常的工作中经常遇到的问题,你可能从网上好不容易下载了一个炫酷的jQuery插件,但是却在打开的时候,发现某几个js文件都是类似“澶у0?...

1969
来自专栏阮一峰的网络日志

字符编码笔记:ASCII,Unicode 和 UTF-8

今天中午,我突然想搞清楚 Unicode 和 UTF-8 之间的关系,就开始查资料。 这个问题比我想象的复杂,午饭后一直看到晚上9点,才算初步搞清楚。 下面就是...

2634
来自专栏码匠的流水账

使用kotlin改善java代码

本文只是举了kotlin可以改善java代码的几个例子,kotlin太强大了,目标是要替代java。其中很多设计可以看到scala的影子,但是黑魔法也比较多,学...

731
来自专栏吴伟祥

编码总结笔记 原

我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一...

1346
来自专栏逸鹏说道

Python3 与 C# 基础语法对比(String专栏)

Python3 与 C# 基础语法对比:https://www.cnblogs.com/dotnetcrazy/p/9102030.html

1142

扫码关注云+社区

领取腾讯云代金券