00:00
哈喽,大家好,我是霍长亮啊,我们继续前面的课程啊,其实呢,我们现在在犹豫啊,这个接下来讲的是关于一个比较大的一个东西,是正则表达式,但是呢,它的理论核心呢,其实还是字符串,所以说呢,咱们想了想呢,还是不单看一张就把它继续简单的介绍一下,还是归类在这个字符串的这一章节里面。我们现在呢啊。还是老规矩,把上面的都先给他屏蔽掉。关于这个正则表达式呢,在字符串处理的时候经常会遇到,因为你会有一些非常复杂的字符串,但是它有一些特殊的规律,你比如说一个大片的文档啊,像呃,举一个实际的例子啊,你在贴吧或者在什么平台中有很多的文本啊,然后呢,你想要把整个文本里面的手机号或者说是呃,其他的什么联系方式把这个提取出来啊,该如何实现对吧?正则表达式就是用来提取这些具有一定规则的文本啊,换句话说呢,它就是用来记录文本规则的一个代码,你之前如果说是学习过呃一语言或者说别的,呃,别的语言的这个上头表达式呢,在这儿呢,就基本上就是一样啊,非常的一样啊,就是类似。
01:26
好,那么咱们第一个呢,要讲的这个应该叫做6.7吧。第一个呢,就是关于这个行定位符啊,他用的是什么呢?是一个向上的一个箭头啊,也就是说我们在半角的时候按住shift,然后摁一下六啊,就是这个字符,然后结束呢,表示的是就是结束是用的是这个前字符啊,它啊这个是开始,这个是结束啊。
02:16
这个是开始,这个是结束,行定位符就是用来描述字符串的边界啊,你组合在一块儿,咱们举个例子啊,你比如说是。对吧,截个截个T吧。你比如说它的意思就是这一行。开头是吧,开头之后是什么是TM,也就是说必须是他开头的才能够匹配的到那么像我们后面,至于写什么怎么就无所谓了啊,你的开头必须是它啊,如果说是。
03:02
这个语句的话,如果是上面的语句的话,你下面的可以匹配的是它啊。后面也可以匹配的是对吧。都可以啊,这个就是关于这个符号,就是这个行开头是后面的PM啊。然后呢,我们要是想设置一个结尾也非常的简单,对不对,你要比如说你改成。前字符现在是大鸟,是啊。这样那么就是以它作为结尾,那么上面呢,你就匹配不成功了,你能匹配的是什么?你前面就随便写吧,但是最后肯定这是TM这样才能够匹配的上啊,你前面可以随便写,最后是TM就可以匹配的上。
04:05
第二个啊,嗯,我就在一块儿写吧,因为咱们一会儿呢,需要讲一个例子啊,没有例子的话,可能大家不太好理解。行定位符和。元字符,上面讲的是这个行定位符,下面要说的是这个字符,对吧,因为我们学完了这个行定位符之后。它只能是一行里面进行一个出题,其实在正则表达式里面还有很多的原字符,你比如说我们现在举一个例子,斜杠呢,注意是半点啊。
05:01
好,那么原字符我们来理解一下该怎么解释,首先啊,咱们先看一下这个斜杠B,它呢,匹配的是单词的开始或者结束啊,对吧,这里有一个。这里有一个这是开始,这里有一个这是结束啊,那么中间是什么M2,也就是说开始是M2开头对吧,结束它没有做限制,然后这个星号呢,就是无限个,多少个都可以,那么综合起来,这个正则表达式的含义就是匹配字母M2作为开头的单词。对吧,先是。有一个斜杠B,这个就是单词的开头,然后呢,匹配的是字母M2是以它作为一个开始,接下来就是任意数量的字母或者数字啊,是什么斜杠W,那么这个斜杠W它所匹配的除了字母数字以外,还可能是下划线或者汉字啊,就是这个。
06:08
斜杠W。懂吗?然后这个。最后的单词是一个斜杠壁啊,这就是一个结束。然后我们用它来匹配的,那就可以是比如说。M2对吧,或者M2。对吧,或者M2。都可以,就是这样的一个意思。然后除此之外呢,还有一些代码,就除了这个斜杠B以外,还有一些啊,我在这里呢,也给大家进行一下常见的。原字符的总结,第一个就是什么是点,那么这个点对应的是什么?就是匹配除换行符以外的任意字符。
07:12
除了换航母以外,它都可以匹配,第二个呢,就是这个斜杠。W,咱们刚才已经说了,可以匹配的是中文英文字母都行,还有下划线。查数字。至于其他的字符对吧,你比如说大于号小于号,这个就不能匹配了啊,这个是W斜杠W。然后呢?斜杠S。
08:03
它呢是匹配任意空格符啊,可以是空格符,然后再往下就是斜杠B。他匹配的是什么,是数字。再往下就是B,就是我们刚才说的开始或者结束,匹配单词的开始或者结束。然后像我们常见的刚刚最开始讲的这个是是字符串的开始。然后这里写一下吧,那后面还记得没忘吧,刚才讲的这个,诶删了没有啊,字符串的结束,那这个呢,就是比较常见的元素,当然肯定还不止这些,剩下的呢,大家有时间的话,自己去百度一下,就是百度搜一下关于正能表达式的。
09:17
原子核啊,然后这些呢,就是我们比较常见的。好,那么说完了这个。原字符之后咱们还需要再聊一下,就是关于它的限定符啊,这个是上我们拆开了吧,这个下一节课再讲一下啊,啊,这节课主要讲的就是定位符和原字符啊,感谢您的关注,我是霍长亮。
我来说两句