00:00
然欢迎各位小伙伴来到学习园地,那么在前面的课程当中呢,给大家去讲解了我们关于操办师的一个技能操作啊和他的解析方法啊,以及我们实弹的一个呃,学习原地的一个登录操作,那么接下来本节课呢,我们继续来看一下啊,策划室的一个呃,实战应用,嗯,那么是这样啊,我们在这个本节课当中呢,我们打开我们当前的这个,呃,Among啊我们当前的网站啊,我们学贤地,那么在学习文原地里边呢,有一个叫做原著啊,原著这个位置我们来看一下啊,原著这个位置呢,是我们发布的一些精品文章,那么我们使用,呃,我们这节课呢,就实战一下,用我们的这个啊爬虫啊来扒取一下这个文章,文章的标题,文章的链接,以及文章的这个呃,发布的信息,那么把这几个信息呢啊,给它提取出来啊,那就说我们用爬虫来做一个这样的操作,那么这里面呢,当然他目前还有一些图片,那么本节课呢,我们暂时先不涉及图片啊,后面呢,我们专门啊抽个时间给大家去讲解一下啊,像这种啊静态资源,比如说图片呀,音频呀,视频啊,这种资源我们应该如何才展啊,其实也非常简单啊,好这样。嗯,那么我们分析一下这个网站啊,在这个网站当中呢,首先我们需要请求这个地址,那我们可以看一下,如果不登录的话,能不能请求个大好来退出去之后来我们点击原著。
01:09
好,它是没问题的啊,它不需要登录,不要登录的话,就是说这个网络呢,这这个页面呢,是公开的,就是大家都可以去查看对不对,那么接下来呢,我们去看一下啊,能不能爬通爬取到这个对应的信息,那么爬取的话呢,我们点击检查,那么看一下上面的这个标题啊,这是一个当前这个文章的一个标题啊,大家能看到哈,在这个div里面对吧?然后呢,它还有对应的,嗯,比如说呃,标题的一个链接啊啊这个位置一个链接,然后还有啊这个作者。嗯,作者在哪个位置。作者啊,作者在这儿啊,在列位的啊,这个作者信息也都有,那我们对应的就是他作者发布的那个文章,以及这个文章对应的那个链接地址啊,那么把它给存储起来啊,存储起来好,那么这是我们分析的结果啊,那么接下来我们看一下用我们的呃爬虫啊如何来完成这样的一个操作,那么打开我们当前的一个呃项目录。然后呢,我们去创建一个新的脚本文件,在这里右键。
02:03
嗯嗯。一个是。实战我们的圆圈啊,圆柱对吧,圆柱圆柱。啊,这个我这个单词因为看不到了啊,所以好奇怪啊,来来来我打电话啊,这个第一个圆。我的妈呀,原著著作这的话我能打出来啊,嗯,怎么讨弄了,嗯,好了,那么这个位置啊,搞定以后,接下来我们看一下啊,分析这个网页啊,这个网页需要查取的呃数据和信息,那么首先的话,我们可以请求这个网页的地址,然后把这个地址呢,全部都呃返回到这个原源代码呢,全部都写到文件里边,然后从文件当中呢,把它读出来,把它进行这样的一个操作,所以这个位置我们来看一下怎么去完成操作,首先第一步我们需要导入我们的request,这全面的对吧,就应mport request EQ ES,好,第二步我们的这个导入我们的E。
03:11
啊B好,接下来我们看一下我们要请求的啊,这里请求的地址,请求的的地址啊,对我们的圆柱。原著啊,我们来写一下这个原著。嗯,我们的原,然后著作的柱是这个啊原柱啊,原柱的这个地址把拿过来复制好,然后呢,这个呃里面呢,有很多的信息啊,有很多信息我们需要的啊,不是并不全部,我们只要一部分就行了,另外呢,呃,加上我们的headas这个he呢,不是所有的网站都需要,但是呢,我们建议大家呢,在一开始的时候呢,给它设置上啊,这样的话在后期呢,你在使使用的时候呢,才不会嗯过容易出问题哈来,所以这个显示图我们复制一下。这这搞定,然后第三步就是我们的请求,就是发请请。
04:08
好,发动解求的话呢,嗯,用我们的快就可以发现求点R上括号,然后写一个等于我们的逗号,我们的等于我们的对吧?好,这样的话,那么发请求,请求回来之后呢,我们判断一下当前的这个请求是不是成功啊,所以呢,re.xd就是后的,如果等等于等等于200啊,那就证明发现的请求是成功了,接下来呢,我们把这个请求的内容写入文件啊,请求的内容,请求的内容写入,写入文件,写入文件怎么做呢?啊,这open对吧?Wi,然后open符号写入我们当前的点,我们就要圆圈点T。这T啊,但是你不去做这个操作也没有问题啊,就是不写也可以啊,但我一般情况下只是推荐大家你请求的内容直接写到文件里边,然后接下来呢,我们再去操作的时候,直接重文念中组,而不要反复的去请求别人的网址,因为呃第一个呢,我们爬成程序呢,呃是一个伪装的啊,那么你呃频繁的发请图呢,对别人的服务器也会造成一个比较大的压力,对吧?啊而且呢,爬虫本身呃也具有增议性对吧?所以呢,嗯,这个你懂了吧?啊所以这个呢,大家呃尽量减少你的请求次数啊,不要给别人的这个呼吸呢造成太大压力啊,这是一个基本的道德啊好吧。
05:21
那么写入,呃,它在这个位置写入成功以后,接下来我们干什么呢?哎,第二步就是要解析数据对吧?好,第二步是解析解析数据,解析数据解析数据,解析数据的话,这样啊,我们把上面的内容呢啊,给它简单的做一个封装,嗯,没有过封的啊封装一下吧,嗯,我我们这样先写,待会我们把它分装成一个函数啊,分装成一个函数啊好,那么接下来啊,当我们现在啊已经搞定第一步以后,那么接下来呢,就是我们要解析我们的这个啊,原原代码源圈的这个H2这个源码,然后呢,开始从里边呢提取我们数据啊,所以S2给我的EE。
06:01
想突然想不起来了,来看一下我们的解析数据的方法啊,第二个方式是啊,1.pass,然后用这个方法来解析,那所以我这里呢,复习复习一下,嗯。好解这个代码,那么这个代码解完以后,接下来呢?啊,我们去啊提取数据,提取数据啊接下来呢,是提取提取数据,提取数据,那么提取的数据第一个是什么?第一个是我们当前的这个叫。啊,文章文章我们需要的啊,需要的是文章标题标题啊,然后呢,文章地址啊,文章地址要用啊对吧,然后呢,还有一个就是作者作者作者。好,那么嗯,到时候我们把它设置成一个一个一个的字点,然后把它给那个叫呃存储起来就可以了,好,那么我们看一下怎么去做呢?呃,提取数据的话,我们先提取一个作者啊来看一下啊,这个叫AX or等于我们的A4.2啊点叉括号,然后呢,去想办法呢,去提取我们的内容,那么在这个提取的过程当当中,我们怎么去做呢?哎,打开我们的浏览器。
07:06
嗯,打开我们的这个,呃,Fire b这个检,呃,这个这个叫什么,我们的检查工具啊,来调试工具,然后点击这个查看元素,找到这个位置,找到这个位置来看一下,好,这个就是当前的,那我们如果能获得到这个信息的,就是当前作者就已经找到了哈,但是找他之前呢,我们就要先看一下。我们在哪里去找啊,以及它这个数据是怎么存储的,那这是一个。啊,那很明显,你看了吗?啊,这个位置就是一个对吧?啊,我们再往上走。嗯,我们看一下P06。这是整个内容,那我们这个也可以。啊,历史的杠科普是吧,啊就有这个信息的,然后找到这个HR之后呢,再去找它里边的所有D里面的。所有div里面的,或者我们找这个也可以。历史因为它每一个标签这个位置都是一样的,对吧,啊都是一样的,这样的话能找到很多,然后每一个里面的啊,这个元素里面的。
08:02
里面的刚才的这个A标签,A标签我看一下呀,A标签太多了。它这个A标签太多了啊,矢状下边啊,矢状只有一个对吧,矢状下边的A标签啊,这样的话比较好找啊,所以我们这里边写的时候可以这么写啊,来斜线电,然后二嗯艾,然后把刚才那个内容呢a sorry。稍微应该写等于有状信息的啊,然后呢,找到这个元素,找到这个元素以后呢,我们再去找它下面呢,死状标签对不对,来复制。状标签下边的A标签下边的KT括号,那么这样呢,我们先去打印一下,看你有没有信息对应的啊,打印一下。好来运行我们找。运行看一下有没有问题哦,啊是空就这么目前没有呼吸到啊,没有呼吸到的话,我们看一下圆圈这个A代码有没有。应该是有的,有的话呢,我们去,呃看一下这个类文件啊,在这个脚本当中存不存在。
09:01
那proceed。我们这个去做一个搜索啊,是不也有啊也有。再往上走。嗯,看来我们刚才找的那个标签还有点问题啊,因为它可能存在很多个。很多个,很多个。还想很多个的货。Old生来copy我在前面的再加一个。括号等于。后啊的内容。Old的,对啊,那个old加这这是一个大的div,然后把它包含起来的,包含起来以后再去找它就得到这里元素,那我们再测试一下,看看有没有效果,那么这样的话,其实我们第一次请求已经成功了,对吧,所以我们不需要再读啊,只需要读就可以了,不需要再再发现了,所以把这个地方注出掉来运行。
10:04
看一下没有,没有的话我们这样做。嗯,首先一个一个看查看一下,就是确认一下当前这个位置啊,确认一下有没有找到第一个标签来运行中间。个没有找到,所以后面的话呢,呃,这些信息呢,就我都失败了,对不对啊,都没有找到,都没有找我。这个未知,因为刚才是什么呢?它并不是等,它并不是等于啊,它并不是等于,因为它不不啊,就说不是只有这一个标签,它是有很多个啊,是有很多个,我们来往上看,在地位置看看。嗯嗯。嗯,来看一下啊,它这个里面呢,还是有很多内容的。肉。嗯,历史。这是一行。银行数据。然后再往上走。就是找他比较合适,那找他的话呢,就有一个问题,所以这个时候呢,我们怎么办呢?哎,打开我们X们去看一下,如果包含两个怎么办,那么这个时候呢,我们去看一下,关于这个叫属性啊,属性的这个多值的匹配啊,属性多值匹配你可以选择这种啊,这个叫什么啊,这个这个叫做呃包含的这种写法,然后呢,也可以写成我觉得还有另外一种写法啊and啊多个字多个字and啊,那我这边呢,写成我们的。
11:18
这种方式吧,来,请先复制。啊,复制一下是在我们这个前面呢,加一个函数进行一个处理,加一个函数进行处理。括号的话,这里面就不是这么写的了啊,第一个是第一个是对吧,第二个是对应的值,所以这里面应该就再写上。好,这么去写,好我们看一下有没有找到。还是功能。还是个空,我们看一下哪里有问题,还是个空,所有的,然后找到这个元素class。然后写杠A,不要写杠A。
12:03
我们不要写完,我们就是找第一个标签啊,现在的话就等于第一标签。找的也不对。行。没有找到。我到哦,Sorry,这个位置有问题啊,圆圈啊这个问题啊。啊,现在找到了对吧?啊,他是找到三个,其实我们可能用不了那么多,用不了这么多,来我们回馈一下代码,看一下我们开始那个是不是能够成功啊。然后把这个改成圆圈。你。没有啊,没有的话,我们确定一下第一个能不能找到。运行。没有啊,没有的话可能还得用。用这个方法来F搜一下这个里面有几个,这一个再往下走。
13:01
啊,Old的是只有一个啊,Old的只有一个的话,那就还是用当才方法啊,还是用刚才呃,我们去使用的这个方啊这种方式来进行过去来复制一下我们当才那个啊,写一下这个方法,然后这个括号啊,写上一个艾class,就是我们确定的是哪个属性,Class的属性确定,然后再确定的是class属性这个值,呃,你要的呢,是包含哪一个对吧?然后把那个复数C,然后放到我们当前这位置,好来我们测试一下运行。好没问题,第一个点单找到了对吧?好,那么接下来就是它下面的这个div div的话,我们分析的这个div是谁呢?是它下面的这个叫历史的对吧,因为这个历史的呢,是有很多个对吧?啊历史的对吧,就这个。所以呢,把这个内容过来。复制好,接下来呢,这里我么写呢,两个斜线,然后div号,呃叫cons,然后呢,括号里面呢写艾特,然后嗯逗号写这个元素。数学元素。
14:01
对吧,好,那我们看一下能不能找到运行总结。啊,它是有找到了很多个对吧?啊,找到很多啊,找到很多以后呢,我们再去找它下边的那个叫叫什么呢?时装标签下边的一个,看一下时装标签。它的死多面在这儿啊,多面下面有个A链接对吧,来再去看。这个叫下边的是状。标签下边的A,链接下边的T括号,然后看一下。嗯,哪里有问题。下边的A标签。来看一下这个解决问题。他说没有找到。没有找到这个位置啊,看一下时装标签。是这个顺序上有没有问题啊,看一下这个div下面。
15:03
里面的子元素找到始终。感觉我应该是没有写错啊,找到的是。这个元素没错。来再看一看啊,可能写错了。历史的group。嗯,格鲁普相对的时钟,这个有问题吗?来运行中年。这是。嗯。嗯,我们看一下,看一下这里面还比较多比较多写的没有问题,来复制一下,我们检查一下啊,因为这呃,每个网页啊,就我们在写盘中的时候,也是每一个网页都需要具体的再去确认一个。这比较多了是吧。我换一个方向控C。竖写。
16:01
好来换成这个,就是我们搜索的时候,这个这个属性给它换掉,换掉以后呢,我们再来看它下边的。啊。哎,还是str。四秒。看一下运行中。好,没有没有问题啊,然后A下边的TT2看一下运线作用。没问题吧,啊,第一个正确啊,然后我们再看一下最后一个,最后一个啊,我们只要在网页里面再确认一下,最后一个是不是就培养来看一下。两年前发表的哦,对没错啊,这个信息是都有啊,这个信息是都有的啊,那这样的话,我们这个页面里面这个信息啊,那就基本上就是全部都获取到了,好那么但是呢,这个位置呢,目前获取的只是什么,只是所有的这个叫用户的啊这个信息对不对,所以我们怎么办呢?我们看一下啊。找到这个标签以后啊,我们稍微再把我们这个代码再进行一个改造,改造我们来一个。
17:00
我们看一下啊,把它赋值给一个变量。我们叫它。啊post,然后呢,接下来在获取的时候呢,写post点放,然后啊呃前面呢,再把这个做的at的之后啊这样获取到,看一下能不能获取啊,因为这样的话,我们嗯应该处理起来我觉得应该会方便很多啊然我们测试一下,嗯把这个内容CX复制过来。再给回去好来测试一下,如果没问题就成功了啊好没问题,历史的在的意思,呃,No tribute啊,就是说他呃当前解过的,呃解析的这个内容呢,是一个多的很多的那个文章内容,那你一个文章内容是无法直接做这样的一个处理的,所以这个是我们我们一个for循环按引我呢。然后里面呢,去使用这个I,然后呢,再进行这个对应的数据的提取,最后呢,我们来这里面呢,去打印这个二的结果来运行中。
18:01
没有问题,但是呢,提取的结果太多了是吧。而且每一个都是一样的。每一个都是一样的。呃,无法直接再获取。啊。好,那这样我们还是用刚才这个方法来测试一下。嗯,写成它对吧,但是这样的话,也就是说我们第一次只能获取到所有的作者a ors啊啊再提取作业啊,作者提取完成以后,再去提取它的文章标题,这个稍微麻烦一下,你叫他提到开TS对吧,那你这样就是说你接下来在这样做处理的时候。很麻烦。啊,我觉得是表码2S,然后把下边去掉,那么接下来呢,我们主要画在后边这个代码,也就是说我们现在呢,获取的这个内容呢,呃,还比较多,对吧,然后我们获取的是谁呢?是。
19:06
这个位置,这个位置。看一看啊,我看他这个啊,看这个看看获取这个文章标题应该在哪个位置。呃,这个div下面,这个div的下面,然后去找。去到A标签。每一个应该都是一样的。好在这里。然后我们再分析另外一个,看看是不是一样。都有,都有信息的话,但我想获取的是这个。嗯。我想获取的是这个信息,所以还不能够嗯,完全去确定,因为里面可能还有链接。这个形式可以了,好。
20:00
好的。复制一下继续啊,来看一下我们这边这个东西啊,呃,这个的话是找到了一个标签,然后呢,再去接下来再去找,嗯,Sorry。啊,找到了一个标签对吧,当然这一个标签呢,肯定是不对的啊,然后呢,我们这里面再写找他上面的div,然后呢,啊继续就是使用我们的这个叫什么,使用我们的这个包含的方法CKS。好,然后呢括号调用这个函数,然后呢来解析塔逗号,然后找到我们对应的。这个元素,然后呢,再去提取啊,提取它里边的A,呃,第一个是A标签啊,这个UR我们肯定要获取,然后还有它这个A标签下边的这个,呃,这个叫什么?这个div对吧?嗯,A标签和div我们先去找div吧,嗯,他div下边的这个。运。
21:01
啊,没问题对吧,好,这个别管了啊,那么接下来下边一步是不是是找起那个title title UR UR title的UR呢,就换成啊。这个位置啊,换成我们对应的。黑标签啊,它的。呃,它的属性,它的属性的话,我要的是哈,对吧,所以这位的A2F来2F。嗯,CR啊,然后这个代码错误来第一个CTRLC数字,第三个CTRLC数字,然后打印激活。来这个位置是不是都搞定了,好都搞定了啊,搞定以后呢,现在这个数据呢,有点呃不太对头啊,为什么呢?因为这个是的啊,就第一列获取的全做的。嗯,第二类呢,获取的全都是它的这个叫什么?呃,它的这个叫叫叫叫叫呃文章标题第三列呢,获取的是全部的这个文章标题啊,文章的这个对应的UR0啊这个链接地址,然后呢,我们需要呃检查呃检查一下它当前的这个长度是不是一致的啊,如果长度也能确定是一致的呢,那就证明我们当前写的没问题对吧?所以呢,啊,这个是。
22:11
哎呀,一个。嗯,不能这么写,一个两个三个。CTRLC复制,然后呢前面。嗯。Ren括号。把这个列表的变量拿过来,我们检查一下它的长度对不对。长度,那我们干脆前面就不打印,打印这个形。好来用行看看长度都是15,那就证明他们的数据正好是一一对应的,对吧?那就没有问题了,没有问题以后呢,我们怎么做呢?在这里呢,用我们的那个叫这函数,然后把当前的a ors,然后还有我们的titles,还有我们的title u对吧,全部放进来,那么最后压成的一个结果对吧?Res,我们看一下。
23:08
所以呢,转一下我们当年的RS最终的结果来运行动力看一下,嗯,它是一个对象的吧,啊对象之后呢,我们用历史啊,它是一个可迭代对项啊,选用我们的这个位置线。Type of that is not。At we。绿色的不能转吗?List不能转。好。我先打印出来好吗?那就是一种用心。这个。嗯,这样的话没问题吧,啊这样的话没问题啊,没问题以后呢,呃,我们要做一个处理,就是把这一个结果呢,变成一个字典,变成一个字典啊啊变成字典对应的呢,我们再进行相应处理,我们看一下怎么去处理呢。贝等于一个括号啊,等于一个中号啊等于中号,然后呢后按in,我们当前的循环第一个就行了,第一个数据的时候,那么注意。
24:07
嗯,在这个当中,这个I,因为他们都是里面嘛,一边的话,I就是下标了,对吧,那么下标以后呢,这个呃,Date中啊或者这吧啊,我们来写一个,再写一个叫res,等于我们的抛括号,那么这个变量当中,Res分括号里边的啊,里边的这个a or作者那就是谁呀,TSOS。AOT。我看一下啊,这个地方好像有点问题啊,因为我们这个时候打印I的时候呢,I的结果就直接就是我们当前的一个呃,一个数据了。列表它不是下标啊,不是下标只是一个数据,嗯,我们想要的是。看下想要的是来run括号,嗯,我们零逗号,Rn re括号,把这个at SOS,然后加一。
25:01
结果加一,结果加一,好,然后呢,再来看I的结果,应该是从呃零开始到15,哦不对不对,我们不用加一直接操作就行了,因为15元素的话,正好下边14就最后一个了,对吧?那么这样的话呢,我们每次做处理的时候就是。就是一个res等于括号,括号里边呢,有一个a or啊or的就是作者,作者的话呢,是O的根号里边的派,对不对,然后第二个呢,是它的title t啊title的话,这里边呢是这个叫啊title是titles中号里边的派元素,对吧?然后再来就是我们的URL啊叫URL,括号呢就是我们的这个叫title u UR,然后中号里边,那么最后我们再来看啊把这个R,因为它是一个字典,一个字典的话给它压到咱们当前的这个药。啊,压到我们当前的这个呃,数组当中,所以呢是贝点括号,然后把这个res给放进去,最后呢,我们re结果来看一下处理的数据对不对啊来运行作用。
26:06
嗯,历史的。啊openend啊a PA PA openend啊单运写作,嗯,来看一下,这里边正好是一个字点啊一个字点,你看呃一个呃,Order,然后呢,一个它那个叫title,然后后面还有一个就是它的UR例址,那么正好对应的这个是啊应该是15条数据啊,那这个数据就已经完成了,完成以后呢,我们下一步啊,可以把它直接写到一个,呃呃写到一个什么,写到一个文件里边啊,写到文件里边怎么写的啊来这里边啊啊提取数据,这个呢是整理数据啊,这个是整理数据的过程,整理数据,整理数据上数据啊接下来呢,整理完数据以后,接下来开始写入啊写入数据。写入数据的话呢,呃,如果你有数据库啊,那你可以现在呢,就把它这个写入到数据库,那么我们暂时呢啊,先去把它写到一个文件里就可以了啊,位置open open方法啊,然后呢,写一个叫圆圈点省的文件啊GG。
27:09
圆圈点G啊,写到等点杠,圆圈点gon啊接省的文件,然后呢,开始用W模式开始写入,写入之后呢,我们嗯就嗯,我们就不写204的模式了啊FPS,然后FP之后我们在这里写入的时候呢,用FP点方,点方这个啊right往里写,但写的时候。因为它是一个字典啊,来我们看它是一个列表,列表里边是字典,我们来测试一下,看它能不能写入什么运行啊外这个时候呢,它只能写入字块,它是无法写入这个内容的,所以你这个时候呢,写入错误了啊,写入错误了,虽然文件文件应该不对啊,啊没有成功啊对好,那写入错误,那么这个时候怎么办呢?来我们把这个谁啊把我们的这个叫。省我们这个的个点节省点儿叫。
28:05
叫damp啊,切点MP啊dampmp,然后里边呢,把这个FP。啊要写进去,然后还有就是我们当前的,呃,这个数据啊,就是来看一下也行。有。不错啊不错啊,重新点击微信。好,又想,诶,呃,杰森是。来,当前的解析是错误。行数。大坡OBG和FP哦,你写错位置啊,所以。大家可以通过。P。嗯。啊,没问题啊,没问题,以后我们来看基层数据,这数据啊,是不是写入了啊,那这里边呢啊,而且这里面呢,就是一个呃,正儿八经的啊,基层格式的一个数据内容啊,一个格式的数据内容啊,那么这样的话就等于把它全部写入,他就说看到这个东西怎么的,这个东西是中文解析,就是用介层解析中文的时候,它就是这样的一个效果,如果他,呃,比如说我不知道他有里边有没有文章是英文的啊,如果是英文的文章的话,就标题是英文单词的,这种的话就不会算,也就说只有只有中文就可能会解析成这样的啊,但它就正好就代表咱们那个中文字符集嘛,6L8的字符集解析的结果,所以它呢,呃本身呢是也是没有错的,那这样的话呢,这个数据就已经解成功了,然后成功以后我们再来回顾一下,看一下我们这个样。
29:27
啊,我们在代码呢,一共分了这么几个部,呃,这个几几个部分啊,第一个部分是发送球,第二个部分呢是专门解析数据,第三个部分呢是专门整理数据啊第四个部分呢,是写入数据对吧?其实写入数据啊和整体数据可以放在一起对吧?啊或者说整体数据和解析数据放在一起啊,然后呢,发动请求放在一起,所以呢,大家呢,可以呃按照这样这样的一个操作啊,把它混装成一个类,封装成一个类啊这样的话操作起来更方便一些啊呃封装的话呢,其实也比较简单,我们可以在这里啊来带他家去手动封装一下啊,然后我们定义一个叫plus plus我们叫它圆圈,好吧,就叫圆圈啊啊,我这里懒得写了啊啊然后这个内容呢,是我们的定义。
30:02
啊,这个地址啊,地址都得写上,然后写好以后这个位置完事,然后接下来呢,定义选择一个方法DF。叫到爱气。是D啊,然后完以后呢,这个初始化的时候呢,是发送一下这个叫请求啊发送请求。换众请求,开始把这个请求的结果呢写入进去,写入进去以后呢,我们就可以去解析数据了,对吧?解析数据的话是不是它叫DF啊,叫pass ta还是passd,对啊,这里一个方法啊,在这个方法当中呢,我们就可以解析数据,然后把这个内容呢往前提取好,提取完以后整理数据也可以放到这好整理数据完成以后,把这个地或者这这等于我们当前的。啊,就说我们把这个数据最终是写入到我们的对吧,所以上面先定一个就是请求,请这个或叫爬取的爬取的数据啊,一开始是一空,那么当我们使用一个方法解析成功以后,那就把这个数据可放到这个对应的位置去啊,那这个位置是。
31:12
没问题,以后开始就最后一个是D是D这个还还有一个就是我们前在定义,不管是函数量,不要和我们变量和我认的模块产生一些突是。然后这个的地址。存,我建议你把它点。They are?就是文件的一个地址,那么上面你把这个数据地址写上存储数据,所以呢,这个位置呢,写上这个。
32:00
啊,这样我们刚才复的这个啊,这就可以啊,嗯,看看还有没有别的问题,应该没有,没有的话我们测试一下。好,当然我这个封装档啊,因为我们是写完之后做的封格啊,所以这个地方你回头可以在直多测试做一个航,就是初始化,然后这里面呢是解数据啊,这里面解析数据啊,然后下面是我们开始写数据数。求的话,嗯。解析成功以后啊,解析成功以后呢,我们把这里啊给它设置好,设置好以后返回复啊,它返回复报S啊复报啊修。啊,行好,然后呢,嗯。上面。啊,这个不需要,这个不需要啊,不需要,所以我们在这里呢,如果他能够成功啊,成功以后啊,成功以后我们这个时候呢,去。初始化解析数据。
33:01
啊,那么对应的话呢,你也可以封装到这里面,也可以拿去用东西啊,所以这位呢,我们嗯,做一个衣,然后呢,嗯,这。如果是我这那这样的话,我们代码就完成一个封段啊,这样的话呢,我们先做一个呃测试啊,那为了测试的更确呃确认一点,所以我们把一些呃这些数据呢,都给它删除掉,删掉。呃,让上图好,上去以后呢,我们来跑一下这个项目,呃,这个问题啊,属这个是个是一二。这个是还是。好,再确认一下,看一下有没有问题。应该就没有了哈,没有错误的话呢,我们就可以,呃,就可以把这个方法的一个实例化,实间标就完事了,来下面实对象。
34:02
来变下,不需要保留这就行。然后呢,圆圈。可以接什么去了?我们的接上念并没有正确哈。圆圈的吗?如果他在这个地方去这个。我们这翻一下这个数据,数据正在写对吧,然后下边呢。什么解析数据?解析数据完全断。这两个位置应该怎样的?好,没问题,然后开始数据执行。
35:03
写好,然后下面呢。写这个地方你想看?数据数据请求成功,正在写入,然后解析数据这个问题啊,解析数据,然后下面呢是。呃,提取提取结果,然后。对的进。关键是。完事了。S点贝塔等于我们的贝塔,然后开始写入。写入的数据是我们。嗯,我感觉好像无所谓。
36:08
嗯。数据之后并没有走到这。判断它的结果。Sorry,调那个。有问题的有问题啊好了,那这样的话我们就不需要打这个好了,那这样的话这个代码就调整完了,那么大家可以看到这个阶层数据就已经写入成功了,那我们也可以打开看一下这里啊内容对吧,没有问题啊没问题好了。好了,那呃,本节课的这个十大案例啊,我们就讲这么多啊,课后呢,大家可以呢,再多多做个练习,那把这个技巧呢,也多多练练啊练习一下,那我爬的呢是一个圆圈,你也可以呢爬其他的内容,比如啊我我爬的是圆柱啊,你可以爬圆圈啊,或者是其他的啊这个文件内容大家呢,多多练习好了,那么本尼课你就到这里再见的小伙伴。
我来说两句