00:00
Hello,各位小伙伴啊,欢迎来到咱们的学学店啊,那么在上节课呢,简单给大家去介绍了一下,我们开当中的这个儿正则模块啊,基本的这个介绍和使用给大家说了一下哈,然后呢,这节课呢,我们先把这个正则表达式的一些这个什么呀,相关的一些函数啊,我们先给大家介绍一下,因为我们如果不了解这些函数的使用的话呢,那后面我们写不了规则啊,所以呢,这个我们来看一下正则相关函数啊叫re模块模块相关哎。模块啊,模块相关函数相关函数。这个定义成三吧,变成了。上面这个也给大家调整一下啊,调整一下。好把它放在这啊,这个是组成对吧?啊组成,然后这个是实D代码,然后这个看能不能调整一下啊。好了,正则达式的组成,然后这个呃是re正则,嗯,Re模块的相关函数啊,这个函数里边呢,它还东西还是比较多的啊,我们先来看一看啊呃,定义一个新的脚本,我们创建打开我们的这个文件啊,然后呃,在这里呢,创建一个新的脚本来给大家去看一下啊,右键选择新建,那是我们的第二个啊第二个啊re,这多模块的相关函数,嗯。
01:04
啊,前面这个点尽量用英文吧。啊,英文的啊好了,定义完以后呢,我们来看一看啊,这个正则啊,相正表S当中的一些相关函数啊,相关函数有哪些,它这个函数还是比较多的啊,比如说这个常用的第一函数叫ma MAT啊,MAT ch啊,Ma函数函数啊,然后前面是re啊re。点点啊呃,Ma函数,然后除了ma函数以外呢,还有一个色啊叫SE,然后呢,除了之外,刚才还有一个点find的叫泛的二对不对啊,然后还有re点泛的艾it t,然后最后还有哪些啊,看一下我们去往下翻一翻啊。嗯,还有一个s re.sub找re.subb括号,然后还有哪些先给大家找一找啊,然后呢,待会我们去,但不一定全部都讲啊,主要是一些相对来讲可能嗯,就是对我们来说作用还比较大的,我们去讲一下就可以了,看一下。别的啊,这个。
02:00
大大,然后卖。啊,基本上就那么多吧,啊,基本上就那么几个,我们先来看一看他对这个麦的一个介绍,这样的,他说如果使俊的开始位置能够找到这个正德表达这一个。嗯,匹配就能就返回一个相应的匹配对象,如果不匹配就返回跟那所以它与什么零长度匹配是不相同的,什么意思呢?就是说我们这个这个max的函数,它这个使用的时候呢,它是从头开始匹配,也就是说这个函数啊,它的功能,它的功能啊,啊它的特点吧,特点第一个是从字符串的开头,从从头开始匹配,从头开始匹配这个内容,嗯,然后这是第一点,第二点呢,就是要么就是要么第一个它就符合要求要么。第一个就符合要求,要求要么要么。要么就是不符合啊,不符合啊什么意思呢?我们来看一看啊,呃,我在下边呢,先写一个这个规则啊,先写一个演示给大家看看啊,比如说我在这里定一个YS等于个I love you to思密达,然后呢,中间我定一个521对吧,I love you这个位置定一个521,然后之后呢,我在这个我定一个这个这个是定义的一个字块是吧?来这样我把上节课的这个这个给大家拿过来来。
03:10
谁裤子拿到这里来?放这啊,给大家看看,这是跟上节课一样的字块,对吧,然后我这里呢定义love,那我现在呢,能不能找到这个内容内,呃,这个内容呢,我们现来看一下啊,我调用这个res,等于我们的这个叫re re点上我们的ma MAT c方法,然后呢,最重要的它是要传两个参数,你要看清楚啊,第一个就是它的规则啊,规则的话我们传reg对吧,第二个的话就是传你那个字号啊,第三个呢是模式,我们暂时可以不用传啊,在普馆看我们当前的RS结果,嗯,其实大家刚刚看到,如果我用find号的话,结果是正确的,能找到对不对,诶结果你看他他没有找到,为什么呢?因为当前呢,他去拿这个love从开头匹配开头第一个不符要求,他是直接失败了,所以就是麦测方法的第一个特点,就是从开头匹配,那么要么就第一个符合,要么就不符合,不符合的话就是呃就是回来了,所以说你要这么写的话,I loveyou,嗯,I love能能找到,哎,他这个时候能够给你找到这个内容啊,这就是我们当前的呃ma的一个特点啊,咱先不管说他找到的是什么结果,但是没有返回now能解意思吧,就是要么第一个字符就开始符合要求,要么就不符合,不符合的结果就返回一个now啊,这是当当前的一个呃结果啊,对,然后呢,我们来看一下啊,匹配成功。
04:13
匹配成功则返回,则返回一个叫什么?返回一个这个叫ma ma ch MAT。CH啊max对象啊,对象一个对象啊一个对象啊对,然后呢,如果否则否则就返回,否则返回,那就是如果第一个就不对,就直接返回了嘛,啊就当前的这个特点啊,那么它返回了这个卖X对象以后,我们从怎么从卖X对象里边得到的结果呢?它是用啊你返回到这个结果里面使用的一个方法叫做group,我说我怎么写错了g group这个方法呢,来进行这个获取,来运行当前的脚本,是不是换取获取了一个I love啊I love,然后呢,我看一下。当前的结果啊,这已经拿到了,已经拿到啊,就可以使用啊,然后呢,返回的结果可以,嗯,可以使用使用g up group GP函数啊,方法方方法获取啊,获取返回的数据啊,访问数据就是从对象啊,可以用这个返回的对象调用这个group框,然后最后呢,呃来获取我们的这个这个对象数据结果啊,然后呢,它除了这样的获取以外呢,它可以使用这个东西叫做呃,Res啊用这个返回的结果就是res,点上一个SPA,那其实大家刚才就看到了,我打印re啊res的时候,它返回了一个呃,Ma对象,Ma对象里边有一些表示哈,对那个表示的内容是什么呢?就是这个东西啊,就是一个元组零逗号五,什么意思呢?就是它告诉你当前找到的这个元素的下标,那么l love5你当前这个字符,当前这个字符是不是就是从那个,呃,零下边开始呢?哎,零下边开始,然后往后走啊,往走123啊,这个是01234。
05:42
对吧,01234,然后五之前啊,为什么返五呢?返回五之前,也就是说到时候呢,你用这个方式来截取的时候,截取到那个从零开始,截取到下边为四的元素啊,那就对了啊,这样这样的话就OK了啊,所以就是这个是获取返回的结果,这个是获取返回的啊,这个是获取返回的。返回的结果,然后啊结果啊,结果数据结果数据啊啊叫数据结果哈,写错了啊应该是数据结果啊,然后下边这个呢,是获取获取获取什么呀啊获取这个叫匹配结果的,结果的叫什么啊下标下标区间啊,下标区间从哪位则方法位置啊就这样的一个特点啊特点呃,这是我们当前的一个呃内容哈,然后还有我们还有我们看看一下还有没有别的,那基本上就这样的一个特点啊,这是我们当前的一个啊mass啊mass来把这个写一下。
06:29
来可以使用啊,这个叫SPN啊,Spans spn函数啊,方法获取啊,获取匹配等。呃,数据。的什么啊,下标区间啊,区间这是当前的一个特点啊,大家看看呃,我们看看还有没有别的要求。基本上这么做,当然它还有一个方法,我们来看一下,嗯。res.groups group groups,我们看一下这个结果有没有了。入是没有拿到,是没有拿到,等到等到那个后面我们讲到那个规则的时候再说吧,啊呃,后面会有一个其他的规则啊好,这是我们认识第一个数叫做ma函数啊,那么除了这个ma函数以外,哎,调用正则函数啊,这个叫ma MAT ch这个函数的一个方法,那么除了哎我们有这个函数以外呢,我们还有另外的这个叫呃,其他的相关函数,比如说这个设,那么这个设方法呢,也跟我们的ma方法呢,非常相近,但是呢,它俩呢是有明显区别的,我们可以呢来看一看,那么我把这个呢写到这啊,来用我们的这个方法来。
07:30
看看这个内容啊,它应该如何去完成,好在这里呢,我们依然啊用上面的规则,Res等于我们的re点色啊SE意思SE啊一次啊设试方法呢,第一个也是正则表,第二个呢是你要匹配的字符串,然后呢,它返回的结果来捆挡看一下RS的结果略显交了重力,大家可以注意看啊,这个返回的结果跟刚才是不是完全一样的啊,完全一样就是目前访问的对象是一样的哈,来print看一下我们的res.group加group,然后呢和print看一下res点,这个叫Spark函数,那么运行角度看一下啊,是一样的对不对,一样的,那么它们俩之间有什么区秒,区别在这,区别在这,我如果把这个I去掉啊,大家记得吧,刚才我们讲的时候,如果把I去掉,就是它匹配的时候,从第一个开始匹配的话,第一个如果不符合要求,直接反回到了对不对,那我们看一下设置啊,设置是属于搜索的意思,他会按照你这个字符号的要求,从头开始到到尾的进行匹配操作,然后呢,如果这期间有,他就直接能给你返回来看一下。
08:24
它是不是依然能返回结果啊,结果我们的设置是返回不了结果的,所以它俩之间呢,就在这个地方呢,有这么一个区别啊,有这么一个区别,也就是说我们这个色此方法呢,来。设置方法,我把这个复制啊复制一下,因为他们俩大部分都相相同啊,只有一部分不一样,所以设置开始呢,是从字符串,字符串从字符。从啊这个叫啊这里写啊字符串开头到结尾到结尾到结尾啊进行进行搜索,搜索式的P配,就是说它第一个不符合哈,那你第一个符合我就说你第二个符不符合啊,就是它跟麦X的第一个区别在这,然后呢,后边这个呢,后边这个是匹配成功啊,它是匹配成功者返回了卖X对象,然后否得了返回档,对不对啊,依然是这样的结果,那么后面的话就是嗯,匹配的获取的结果用group普和SPA依然能拿到,看还有别的吗?嗯。
09:12
没有必要,他们俩之间的区别就在这里,我们来这里就直接把这个设置和麦子的方法的区别给大家去讲讲,嗯,这个基本上就这么说吧,你在后期如果工作过程当中啊,去面试爬虫相关的岗位的时候,这个设置和啊,设置和二的方法的方法的区别这个问题啊,99%的可能性都是我的啊的区别,区别是什么啊,大家呢,也可以自己总结一下啊,也就是说呃,我们这个MAT cht ch方法啊,方法是从字符串的开头进行进行匹配,进行匹配,如果开始。啊,如果开始就不符合不符合这个正则,正则的要求,要求则匹配失败,则匹配失败啊,则匹配失败啊就那样的一个过程啊,匹配失败。
10:02
失败返回对吧,然后呢,我们的这个设置方法啊,它的特点不一样,这个设置的这个方写一下这个这个中文不对啊。好,我们这个设置方法呢,方法是从是从字符串到开开头啊开知道吗。呃,开始位置一直一直匹配到一直搜索,搜索到最后搜索到字符串到最后,最后如果啊,如果在字符整个字符串中,整个。整个字符串中啊中都没有,都没有匹配二则。失败,失败。失败啊失败然后返回,那也就是说他们俩在搜索的模式上啊,有一点区别啊,这就是我们当前一个设置函数和max函数,以及他们的一个呃方法的一个区别啊好,那这个呢,那希望大家呢,在待会儿的这个课下呢,把这个内容呢,简单的先做一个练习,先认识一下这两个函数,基本上就是说在面试的过程当中,设置和max方法基本上是你在未来面试过程当中的必问的这么一个啊问题吧,好,然后在下节课呢,我再把这个相关的其他几个函数呢,再给大家去介绍一下,好吧,好,那各位小伙伴,我们这节课呢,就先到这里。
我来说两句