00:00
OK,同学们,那么我们把这个流程控制语句讲完之后啊,我们接下来的一个大模块呢,就是讲这个数据类型的高级了啊,那么数据类型的高级无论是我们字符串啊,列表啊,元组啊,字典都会做一些详细的阐述啊,每一个都会给各位同学进行一个解释,那么接下来我们要讲的第一大模块呢,就是数据类型高级中,我们的第一大模块是指的是啥呀?叫做字符串的高级。有的同学老师啊,啥叫注册高级啊,这里边的很多东西啊,都是注册的方法,那何为方法呢?就假如说我们在做爬虫的时候,你爬取的数据很多时候都不是我们直接想要的数据。对吧?都是一个租串,而这些租册里边的部分数据是我们想要的,那你怎么去处理呀?你是不是会针对这些租串做操作呀?举例说明,假如你现在获取的字串数据是这样的啊,一井号二井号三井号四,好同学们,你这种数据啊,你想要的是1234,但是你爬取的数据它给你是一减二减三减四,那这个问题你应该怎么去处理呀?对吧?哎,所以说我们接下来学的东西叫啥呢?就是一个字符串的一些方法。
01:34
当然字符算的方法远不止这些啊,注册的底层的源码一共有3006行代码啊,封住了很多很多的方法,而我们在这里边给大家讲解的是我们在爬虫中大部分是的场景下都能适配的方法啊,都能适配方法好,同学们,那么接下来我们就来记住这些东西,好,我们先创建一个啥呀,创建一个文件啊,这是031,嗯,然后上龟谷爬虫。
02:07
回头呢,大家看这些笔记和视频是能对上的啊,课件都能对上了的啊,然后这个是什么呢?是字符串的高级,好同学们那注券高级里边我们第一个方法要讲的是谁呢?叫做Les啊,当然有同学老师我怕记不住你咋整啊,你把这个拿回来对吧?哎,你我把它干啥给放在这里边,你放在这里边之后你再找不就完事了吗?是不是?嗯,这样是可以的啊,我把它对齐一下对吧,有点有点小模样,对齐一下,你将来看的时候也好看是吧?嗯。然后再来对齐。啊,再来。再来。OK啊,是这些东西后边,前边呢是它方法的名字,后边呢是它的介绍啊,OK,同学们,第一个我们要学的东西就是Les,刚才我给大家解释过了,它是啥呀?叫做长度,这个length呢?它是谁的缩写呢?是lengths的缩写。
03:10
啊,长度的意思啊,长度它主要作用就是判断字符串的长度,但是同学们,刚才你发现了,它不仅仅可以判成啥呀,字符串长度还可以干啥,是不是可以判断列表的长度,同学们对吧?好,那现在呢,我来定义一个字符串叫S。SS等于啥呢?等于China,好,我接下来用它这个let方法来干啥呢?来使用一下来print,记住同学们啊,它的使用规则是区别于其他的方法的。啊,一会我写第二个方法的时候,我就告诉你它区别在哪啊,为啥它会这区别都解释一下啊,第一个Les写个谁呢?S对吧?它的意思是啊,判断一下S这个字符串的长度,好同学们我来运行一下,结果应该是五吧,嗯,没问题。
04:07
好,OK,那么下一个叫啥呢?叫做find find是啥?查找指定内容在字符串中是否存在,如果存在,同学们,如果存在,就返回该内容在字符串中第一次出现的索引值、索引位置啊,如果不存在,则返回负一啊,是这样一个结果,那我知道了,假如说S1等于谁呀?还等于拆呢。好,那么这个方法怎么去使用呢?我记得我刚刚才跟大家说过,我说呀,LAS方法的使用是区别于字符串其他方法的,那它的区别在于哪呢?就在接下来的使用上说,它应该咋用S1.find而不像啥呀,而不像直接lengths s啊,这是不一样的哈,点find,咱说这里边应该传个啥呀,传个字符呗。
05:08
那它的作用是返回这个C在字符串中第一次出现的位置,我们来运行一下走是不是零啊?对吧,有的老师,那我给他改成A吧。嗯。走是不是四啊,01234,下标从零开始啊,下标从零开始,你别瞎查啊,雨同学老师,那我后边如果再给个C的话,我再传一个C会返回的是零还是五啊,是零,为啥呀,因为他返回的是第一次出现的这个位置啊,千万注意这个他叫find find完之后我们接下来要学一对双胞胎啊,你要说说双胞胎也行啊,就是以谁谁谁开头,以谁谁谁结尾,一个叫star with,一个叫安with。
06:03
好,同学们,那么这写个S2等于啊,还是China,那么它是啥呢?叫做以谁谁谁为开头,以谁谁谁为结尾,那么说如果它是以这个字符以为为开头的,如果它以这个字符为结尾了,那么它则返回啥?则返回处啊,如果不是这样,那会返回啥呀?返回的是false啊,是这样的,OK,同学们,那接下来呢,我们来完成一下这两个方法来prints2.startwith啊记住啊,同学们,如果你在这块没有提示的话,Start后边有个S千万不要忘了,边有S千万不要忘了啊好,是不是以C开头的呢?来走是啥是处吧,没毛病啊,我猜那确实以C为开头的,那我是以这个这个H开头的吗?不是啊,所以返回的是false啊,OK,就是它了,那紧接着我们还有一个啥呢?S2.ns位,Ends位也是一样的,在N的后边有一个啥呀?S千万千万不要忘了啊,千万千万不要忘了,那它是以A为结尾的吗?来试试,嗯,走是不是以A为结尾的?那它是以这个N为结尾的吗?肯定不是,不是的话则返回false啊,是这样的,OK,这是以谁谁谁为开头,以谁谁C为结尾。好,同学们,那接下来我们要再学一个方法,这个方法呢,叫做count,那它存在的意义是啥呢?它来统计某些字符出现的次数。
07:57
啊,统计某些字这个字符出现的次数,那我们现在来写一写呗,这个咋用啊,会不会有什么坑啥的呢?来S3等于AAABB,哎,打印一下S3点什么count。
08:18
嗯,Count count里边写个谁呀,写个A,我看一下它的结果是啥。是不是三个位统计了字符串中出现某字符的次数,如果再给它改成B呢?就是解了,同学们是不是改成二就就变成二了呀,对吧?哎,非常简单,你看这个也不需要我们自己去写了,它帮助我们干啥呀,帮助我们去做的啊,帮助我们去做的好,同学们,那么紧接着接着还有一个叫啥呢?叫replace,那么replace的意义是啥意思?它叫替换。哎,替换来,我们来写上S4等于谁等于CCCCDD好,他要干啥?他要把这个CCC全部给我替换成DD啊,全部换成D,那咋来呢?来来普呃be了S4.replace啊replace。
09:21
第一个呢,你看哈,这叫旧的字符串,因为你要知道我不是把F4里边所有的替换吧,是不是各位你要干啥,你要把S4里边的个别的东西是谁呀,是C吧,要你看它写着呢,O的I tr,然后接下来new的it tr要换成谁来着D对不对,嗯,来走你你们发现哎,没打印哈,我再打印一下。打印一下这个,打印一下它哈,Print。嗯,来,我再来运行一下看是不是啊各位,哎,就可以了啊就可以了,这叫替换啊,替换repla替换好同学们,那接下来我们再看还有什么方法呀,叫撕Li,撕Li就是啥意思啊,叫做切割,哎,啥叫切割呢?我记得在开始之前呢,我跟大家解释过这样一件事,我说呀,你爬取的数据啊,它的格式可能是各式各样的,例如一井二井三井四,对吧,我要的不是这个,我要的是啥?同学们,我是不是要的是123呢?1234啊,那景不要咋整啊,我们就可以用它的切割,切割之后它变成了一个数组啊来看一下S5.sli里边按谁切割呀,是不是按井切割呀?哎,按井切割,切割完之后是不是剩1234了,看。
10:59
是不是剩1234了,对吧,大家你不要那个节啊,不要那个节,有的人老师你这个不变成一个列表了吗?那列表之后咋整啊,别着急,等我们学列表之后,我们再教你一个方法,你就能把它再变成字符串了,就很OK了啊,很OK了,好,同学们,那这是切割叫做Li,接下来又又一对啊,叫啥呢?叫转大写和转小写。
11:28
那现在我们来看一下S6等于啊,先转成大写吧,啊,China,然后来打印一下S6.upper,哎,里边啥也不传啊,它啥意思呢?就将里边所有的小写字母变成了大写,走,你看到了吧,China,好,同学们,那我们再来一个吧,S7等于大写的好,那要干啥呢?把所有的大写字母全都给我改成小写字母。
12:06
走哎,OK了,这没问题,有同学老师拿这玩意有啥用啊,有用,你将来在做验证码的时候,同学们你输入的那个验证码你做爬虫啊,你必须得绕过登录吧,你绕过登录的时候,是不是人家有验证码,而这个时候你就需要到转大写转小写了,为啥呀?因为它的验证码你虽然能获取到,但是你输入的时候大小写是不是应该都不区分呢?那咋办呢?你就把它全都干啥呀,要么全都给我转成大写,要么全都转成小写,我一判断是不是就OK了,对不对啊,所以这这块千万要注意啊,千万要注意。接下来我们要再讲最后两个方法,一个叫做strip strip的意思叫啥呀?叫做去空格。那么何为去空格呢?同学们看啊,写个S8等于看同学们空格,一空格俩空格三空格,然后写个A,然后在一空格俩空格三空格,请问同学们,我现在判断一下它的S8的长度结果是多少?
13:18
左边三个,右边三个,中间一个是七吧,是不是没问题,各位啊,没问题,OK,那啥叫区空格呢,同学们你看。那prints啥,S8.strip。哎,Strip啥意思,我将S8去空格之后,再判断一下长度,同学们,它去空格左边右边是不是都不要了呀,那你都不要的话,结果就剩谁了,是不是剩一了,哎,这个去空格它非常非常的常用啊,记住同学们,它非常非常的常用。好,接下来我们再讲最后一个方法叫做啥呀,叫做转,哎转,那转是啥意思呢?叫做拼接S9,等于hello啊hello,然后我们现在来打印一下S9.join,那写个啥呀。
14:21
写个A吧,我来看一下啊,走,我发现,诶,怎么只有A呢?这里面不对呀,它的调用者难道和我们想象的不一样吗?啥情况啊?对吧,哎,这会不太一样啊,同学们,你看我把A和hello变个位置啊,A和hello变一个位置,我们再看一下子啊,啊,现在运行一下。走我们发现呢,它就不一样了,那是这是啥问题呢?我大家注意啊,它这个设计其实我认为不是特别的好啊,我认为它这个设计不是特别好,你看它干啥了,它是不是将这个字符串,你看它加到这个字符串里边,所以是helalao。
15:15
啥意思呢?同学们是不是将这个字串里边的数据往这个字串里边一个一个加呀?是吧,每一个珠算里边后边是不是都加,直到最后这个O不要啊,我认为它这个方法的设计非常的不好,按照我们来讲哈,我们来讲它就应该是一个拼接,应该返回啥a hello。对吧,或者hello a,这是我们能理解的,但是Python的这个设计我认为它非常非常的不友好啊,它的这个使用竟然是将这个注串一个一个的插入到与这个注册的啥每一个元素的后边啊,这个大家呃可以忽略不计啊,但是现在来讲我们后期有方法来替代它,好,同学们,以上就是我们关于字符串的一些方法,需要同学们把它背下来,为啥呢?我在爬虫中一定都会用到啊,一定都会到,OK,同学们,那我把视频暂停一下。
我来说两句