前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >正则表达式

正则表达式

作者头像
小胖
发布2018-06-27 16:03:43
5120
发布2018-06-27 16:03:43
举报

一、概述

正则表达式(regular expression)是一种表达文本模式(即字符串结构)的方法,有点像字符串的模板,常常用作按照“给定模式”匹配文本的工具。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

JavaScript通过内置对象RegExp支持正则表达式,有两种方式创建正则表达式对象。例如,如果我们想匹配字符串中所有"at"的实例,可以这么写:

  • 第一种:使用字面量,以斜杠表示开始和结束。
代码语言:javascript
复制
 var reg=/at/g;
  • 第二种:使用 RegExp 构造函数。
代码语言:javascript
复制
 var reg=new RegExp('at','g');

上面两种写法是等价的,都新建了一个内容为at的正则表达式对象。它们的主要区别是,第一种方法在编译时新建正则表达式,第二种方法在运行时新建正则表达式。

最后的g代表全局,还有几个修饰符:

  1. g:global,全文搜索,不添加的话搜索到第一个结果停止搜索
  2. i:ingore case,忽略大小写,默认大小写敏感
  3. m:multiple lines,多行搜索

二、正则对象的属性和方法

(1)属性

正则对象的属性分成两类。

一类是修饰符相关,返回一个布尔值,表示对应的修饰符是否设置。

  1. ignoreCase:返回一个布尔值,表示是否设置了i修饰符,该属性只读。
  2. global:返回一个布尔值,表示是否设置了g修饰符,该属性只读。
  3. multiline:返回一个布尔值,表示是否设置了m修饰符,该属性只读。
代码语言:javascript
复制
var r = /abc/igm;

r.ignoreCase // true
r.global // true
r.multiline // true

另一类是与修饰符无关的属性,主要是下面两个。

  1. lastIndex:返回下一次开始搜索的位置。该属性可读写,但是只在设置了g修饰符时有意义。
  2. source:返回正则表达式的字符串形式(不包括反斜杠),该属性只读。
代码语言:javascript
复制
var r = /abc/igm;

r.lastIndex // 0
r.source // "abc"
(2)test()

正则对象的test方法返回一个布尔值,表示当前模式是否能匹配参数字符串。

代码语言:javascript
复制
/cat/.test('cats and dogs') // true
(2)exec()

正则对象的exec方法,可以返回匹配结果。如果发现匹配,就返回一个数组,成员是每一个匹配成功的子字符串,否则返回null。

代码语言:javascript
复制
var s = '_x_x';
var r1 = /x/;
var r2 = /y/;

r1.exec(s) // ["x"]
r2.exec(s) // null

三、字符串对象的方法

字符串对象的方法之中,有4种与正则对象有关。

  1. match():返回一个数组,成员是所有匹配的子字符串。
  2. search():按照给定的正则表达式进行搜索,返回一个整数,表示匹配开始的位置。
  3. replace():按照给定的正则表达式进行替换,返回替换后的字符串。
  4. split():按照给定规则进行字符串分割,返回一个数组,包含分割后的各个成员。
(1)String.prototype.match()

字符串对象的match方法对字符串进行正则匹配,返回匹配结果。

代码语言:javascript
复制
var s = '_x_x';
var r1 = /x/;
var r2 = /y/;

s.match(r1) // ["x"]
s.match(r2) // null

从上面代码可以看到,字符串的match方法与正则对象的exec方法非常类似:匹配成功返回一个数组,匹配失败返回null。

如果正则表达式带有g修饰符,则该方法与正则对象的exec方法行为不同,会一次性返回所有匹配成功的结果。

代码语言:javascript
复制
var s = 'abba';
var r = /a/g;

s.match(r) // ["a", "a"]
r.exec(s) // ["a"]
(2)String.prototype.search()

字符串对象的search方法,返回第一个满足条件的匹配结果在整个字符串中的位置。如果没有任何匹配,则返回-1。

代码语言:javascript
复制
'_x_x'.search(/x/)
// 1

上面代码中,第一个匹配结果出现在字符串的1号位置。

该方法会忽略g修饰符。

代码语言:javascript
复制
var r = /x/g;
r.lastIndex = 2; // 无效
'_x_x'.search(r) // 1

上面代码中,正则表达式使用g修饰符之后,使用lastIndex属性指定开始匹配的位置,结果无效,还是从字符串的第一个字符开始匹配。

(3)String.prototype.replace()

字符串对象的replace方法可以替换匹配的值。它接受两个参数,第一个是搜索模式,第二个是替换的内容。

代码语言:javascript
复制
str.replace(search, replacement)

搜索模式如果不加g修饰符,就替换第一个匹配成功的值,否则替换所有匹配成功的值。

代码语言:javascript
复制
'aaa'.replace('a', 'b') // "baa"
'aaa'.replace(/a/, 'b') // "baa"
'aaa'.replace(/a/g, 'b') // "bbb"

上面代码中,最后一个正则表达式使用了g修饰符,导致所有的b都被替换掉了。

replace方法的一个应用,就是消除字符串首尾两端的空格。

代码语言:javascript
复制
var str = '  #id div.class  ';

str.replace(/^\s+|\s+$/g, '')
// "#id div.class"
(4)String.prototype.split()

字符串对象的split方法按照正则规则分割字符串,返回一个由分割后的各个部分组成的数组。

代码语言:javascript
复制
str.split(separator, [limit])

该方法接受两个参数,第一个参数是分隔规则,第二个参数是返回数组的最大成员数。

代码语言:javascript
复制
// 非正则分隔
'a,  b,c, d'.split(',')
// [ 'a', '  b', 'c', ' d' ]

// 正则分隔,去除多余的空格
'a,  b,c, d'.split(/, */)
// [ 'a', 'b', 'c', 'd' ]

// 指定返回数组的最大成员
'a,  b,c, d'.split(/, */, 2)
[ 'a', 'b' ]

上面代码使用正则表达式,去除了子字符串的逗号后面的空格。

代码语言:javascript
复制
// 例一
'aaa*a*'.split(/a*/)
// [ '', '*', '*' ]

// 例二
'aaa**a*'.split(/a*/)
// ["", "*", "*", "*"]

上面代码的分割规则是0次或多次的a,由于正则默认是贪婪匹配,所以例一的第一个分隔符是aaa,第二个分割符是a,将字符串分成三个部分,包含开始处的空字符串。例二的第一个分隔符是aaa,第二个分隔符是0个a(即空字符),第三个分隔符是a,所以将字符串分成四个部分。

如果正则表达式带有括号,则括号匹配的部分也会作为数组成员返回。

代码语言:javascript
复制
'aaa*a*'.split(/(a*)/)
// [ '', 'aaa', '*', 'a', '*' ]

上面代码的正则表达式使用了括号,第一个组匹配是“aaa”,第二个组匹配是“a”,它们都作为数组成员返回。

四、习题练习

1. \d,\w,\s,[a-zA-Z0-9],\b,.,*,+,?,x{3},^,$分别是什么?
  • \d 表示数字字符,等价[0-9]
  • \w 表示单词字符、字母、数字、下划线,等价 [a-zA-Z_0-9]
  • \s 表示空白符,等价[\t\n\x0B\f\r]
  • [a-zA-Z0-9] 表示小写字母、大写字母、数字
  • \b 表示单词边界
  • . 表示除了回车符、换行符之外的所有字符,等价 [^\r\n]
  • * 表示 0 次或多次,等价 {0,}
  • +表示 1 次或多次,等价{1,}
  • ? 表示 0 次或 1 次,等价 {0,1}
  • x{3} 表示 xxx,即x出现3次
  • ^ 表示以xxx开头
  • $ 表示以xxx结尾
2.写一个函数trim(str),去除字符串两边的空白字符
代码语言:javascript
复制
function trim(str){
    var newstr = str.replace(/^\s+|\s+$/g, '');
    return newstr;
} 
var str = '  #id div.class  ';
trim(str) //"#id div.class"
3.写一个函数isEmail(str),判断用户输入的是不是邮箱
代码语言:javascript
复制
function isEmail(str){
    return /\w+@[0-9a-z]{2,8}\.[a-z]{2,5}/.test(str)
}
isEmail('dcsff@gamil.ie');//true
4.写一个函数isPhoneNum(str),判断用户输入的是不是手机号
代码语言:javascript
复制
function isPhoneNum(str){
    return /1[34578]\d{9}$/.test(str);
}
isPhoneNum('13888032098');//true
5.写一个函数isValidUsername(str),判断用户输入的是不是合法的用户名(长度6-20个字符,只能包括字母、数字、下划线)
代码语言:javascript
复制
function isValidUsername(str){
    return /^\w\S[^\W]{6,20}$/.test(str)
}

isValidUsername('hin9xx3_*');//false
6.写一个函数isValidPassword(str), 判断用户输入的是不是合法密码(长度6-20个字符,只包括大写字母、小写字母、数字、下划线,且至少至少包括两种)
代码语言:javascript
复制
function isValidPassword(str){
    var pattern = /^[0-9]$|^[A-Z]$|^_$|^[a-z]$/g;
    var pattern1 = /\W/g;
    if(str.length<6||str.length>20){
        return false;
    }
    if(pattern.test(str)){
        return false;
    }
    if(pattern1.test(str)){
        return false;
    }

    return true;
}
isValidPassword('eudh76_*')//flase
7.写一个正则表达式,得到如下字符串里所有的颜色(#121212)
代码语言:javascript
复制
var re = /*正则...*/

var subj = "color: #121212; background-color: #AA00ef; width: 12px; bad-colors: f#fddee #fd2 "

alert( subj.match(re) )  // #121212,#AA00ef
----------------------------------------------------------------------------
var re = /#[0-9A-Fa-f]{6}/g;
var subj = "color: #121212; background-color: #AA00ef; width: 12px; bad-colors: f#fddee #fd2 "
alert( subj.match(re) )//["#121212", "#AA00ef"]

(8)下面代码输出什么? 为什么? 改写代码,让其输出hunger, world.

代码语言:javascript
复制
var str = 'hello  "hunger" , hello "world"';
var pat =  /".*"/g;
str.match(pat);
------------------------------------------------------------------------
var str = 'hello  "hunger" , hello "world"';
var pat =  /".*"/g;
str.match(pat);//匹配的内容是:[""hunger" , hello "world""]匹配的是""内的任何字符0次或多次
pat = /".*?"/;//改后,匹配 0次或者1次,变成非贪婪匹配
str.match(pat)//[""hunger"", ""world""]
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.09.16 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、概述
  • 二、正则对象的属性和方法
    • (1)属性
      • (2)test()
        • (2)exec()
        • 三、字符串对象的方法
          • (1)String.prototype.match()
            • (2)String.prototype.search()
              • (3)String.prototype.replace()
                • (4)String.prototype.split()
                • 四、习题练习
                  • 1. \d,\w,\s,[a-zA-Z0-9],\b,.,*,+,?,x{3},^,$分别是什么?
                    • 2.写一个函数trim(str),去除字符串两边的空白字符
                      • 3.写一个函数isEmail(str),判断用户输入的是不是邮箱
                        • 4.写一个函数isPhoneNum(str),判断用户输入的是不是手机号
                          • 5.写一个函数isValidUsername(str),判断用户输入的是不是合法的用户名(长度6-20个字符,只能包括字母、数字、下划线)
                            • 6.写一个函数isValidPassword(str), 判断用户输入的是不是合法密码(长度6-20个字符,只包括大写字母、小写字母、数字、下划线,且至少至少包括两种)
                              • 7.写一个正则表达式,得到如下字符串里所有的颜色(#121212)
                              相关产品与服务
                              Elasticsearch Service
                              腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
                              领券
                              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档