00:00
好,接下来呢,我们要想办法把数据啊保存在数据库中了,那么在保存之前呢,我们需要首先啊,得去建一个这样的集合才能保存下来,是不是,那我们就去建一个model来controlt v叫做S,还有ES tras,好OK。然后呢,我们这里就改一改啊,有些东西不用动,我就不动好来看啊,首先呢,它这里呢,会有一个到时候会取一个image,到时候看一下有没有啊。我们呢,首先爬取哪些图片,呃,看一下首先这个封面图是不是有了分面图爬取到了,好像咱们还有一个东西没爬取到,呃,咱们还差一张图片没爬到,咱们还有一张这个图片,海报图是没爬去的,这个图片我们忘记爬去的,要把这个海报图给爬去了,那这张图片呢,就保存为image,是不是这个RF为V干。
01:01
Image是不是,那我们复制一份啊,再找一个跟它类似的一个东西,把它给找到啊,就这个东西吧,Ctrl me,然后这里面呢,是这个海拔图。啊,对的呢,它是好复制。整体是不是v image的这个。Src属性啊,是不是一个image的a tr,嗯,Src属性才是我想要的东西啊,Src属性好,这里面呢,我们将将它命名为image,然后最终记得要把它给返回出去才行啊,返回出去好image也有了,那我们再看一下我们的东西。啊,值也没问题,豆瓣ID是不是没有啊,是不是差一个豆瓣ID,那我们也把豆瓣ID拿到在这里面,我们看一下哪里能获取到豆瓣ID呢。
02:01
啊,其实获取它的办法呢,应该有很多种,比方说呢,我这个连接地址呢,其实就有,是不是连接地址就有,然后呢,我们看一下有没有更好获取的一些地方啊有如果有更好获取的地方的话呢,那就最好不过了,我们在这里呢,把它给CTRLC一下,然后呢在下面的CTRLF。CTRL1好找一下哪里看一下有没有相关的内容。找下下一个。看有没有直接是我这个地址的,那么我就可以直接爬去的啊。诶,这里有个电影上面呢,上面是subject好,这里有个电影是不是,然后呢,看一下除如果除了这个地址以外呢,我还能在哪里拿到。啊,这是一整个A标签,A标签这里面有12ID是他的,好吧,那我们假设我们对这个。哎,其实我们就对这个连接地址做一些处理吧,我们是不是就是想要这个ID啊,那我们既然能拿到这个连接地址,就对它进行处理吧,这个连接地址呢,在我们的里面,在这里面呢,我们可以在哪里拿到呢?
03:15
我们呢,通过获取什么,这里其实有这个ul,是不是每次能拿到啊,但是呢,我这页面上拿不到,那页面上拿不到的话呢,我就在在页面上想办法拿到我这个链接地址,我就找一个标签,找一个有这个地址的,嗯,来我们看一下上面有没有类似的一些标签,它能够提示给我一些相应的信息啊,然后标题没有,标题没有,然后呢。这里面看下有什么标签。好像这里面没有看到类似的一些相应的内容啊,他呢,只有在这个。Meta标签中的确有啊,然后呢,除了这个标签外呢,还有哪些标签看一下还是要找一下啊。
04:03
在这里面想办法拿取到A上面有一个比较好用的。这里有个分享到的一个标签,是不是好,这里是有一个,我觉得还有一个更好的。应该这个我们找这个标签,这个标签呢,它有一个shell ID,是不是直接是这个ID啊,直接是这个ID,我拿到这个属性是不是就够了,那么这个东西要拿到的话呢,我就得想办法找到相应的,怎么样找到这个标签啊,那这里面是不是有些class啊,我们看一下首先有个应该是这两个东西,我们看一下是不是通过这两个能找到我想要的东西啊。那我在这里页面上去模拟一下,看下行不行找得到啊,也一个是点这。哎。好,除了这个克拉斯,是不是还有一个克拉斯,他们两个应该是。应该是一个并集是不是,所以说这时候呢,他在这里面找几个。
05:02
是不是找到一个说明,这样是不是能找到这个元素,还能找到元素的话呢,我就把它复制下来,那这个元素上面呢,就有我想要的豆瓣ID,那我也获取下豆瓣ID啊,豆豆符大括号,呃,不需要它上面的一个属性,那我们也通过这个属性去拿到叫做。叫做shell ID是不是shell ID,那SHEID好,我来这个多半ID。呃,余我这个ID,然后呢,拿到我的动漫ID啊。好,这个ID也拿到了,那我就把它放到下面去。加上去好,这里面ID也有了,那我在这个ID中呢,我这里再检查一下,我们这里面ID也没问题,这个也有,是不是它呢,也是数组啊,这里面呢,我们看就是导演和演员,他是一个数组还是一个什么啊。咱们在这里面除了一个这个东西,它呢,是不是到时候会变成数组啊,是不是我的类型会变成个数组,其次呢,我的。
06:09
卡S是不是也是个数组啊,我的演员主演也是个数组,然后呢,别的没有了,是不是啊,这里要注意就是我们的演员和我们的类型是不是当初候会是个数组的方式,那么我们就得去改一改啊,我们的演员呢,他到时候是个数组,我的类型是不是也是数组好类型不用改,我的演员要改好,改完之后呢,Sub没问题,上映时间没问题,Bos key呢,是最终我要返回的key,除了bos key呢,我待会还有两个key值,一个是car key。看什么呢?是我那个,他说这是我那个海报图片,是不是海报图片,然后这个超呢,是我那个视频的封面图,是不是视频的封面图,除了这个key呢,还有个key叫做VD有video key,这个video key是什么呢。
07:08
是不是最终我要爬取的那个?视频啊,对不对,这个呢,最终我是不是整体的视频,我也上传到气中,它呢,也应该返回一个给我啊视频的。这就是视频,视频的key等等啊好,这些东西以上呢,我们查一下到底有没有漏网之鱼啊,咱们呢,有这么多属性了,是不是我们看一下有没有其他的漏网的。呃,这个和瑞不需要保存啊,咱们的cover有了,Cover有了,然后呢,Title director这东西是不是都保存下来了,都保存下来了,然后呢,有一个东西可能现在还没存下来,就是我这个最终是不是要保存这个link,这个link是不是也要想办法给保存下来,这是我那个视频的地址,是不是视频的地址,所以说我在这里面呢,我得去写个link啊,Link呢是我的视频的地址,比如写在下面的link是我的视频的地址啊,它的值也是一个。
08:13
String是不是好,到目前为止呢,咱们这个东西呢,就算是写的差不多了,所有的类型呢,都能保存下来,都能保存下来,好,那我们呢,在这里呢,就去处理一下这个东西啊,我们这里面呢,叫做trainer ts,好train然后呢把它改一改,这里改TES啊好这个呢就是我们的,然后这里也改一下,这里改一下就可以了,好,咱们的这个模型对象呢,就创建好了,是不是创建好之后呢,接下来呢就去我们的。是不是跟之前写的一样的,我们爬取完之后,是不是要建一个save去保存下来,建个save保存下来,同样的复制一份呗,我们改一下名字叫做trains ts好。
09:05
保存下来之后呢,我们来看啊,首先呢,我们要引入的集合就不是这个东西了,它是。是不是trade啊,是这个集合好引入之后呢,待会呢,就会把这德塔呢塞进去,那我接下来就是去变临这个德塔,然后拿到每个item,然后呢,在这个集合里面呢,去创建新的一个东西,然后把所有的数据是不是塞进去啊,然后这里面大家补充一些数据,补充哪些呢。我下面补充吧,一个是link叫做link,是不是还有哪些需要补充的?我们看一下啊。呃,Link要补充title这些东西呢,都前面都是一样的,是不是是不是link好这三个咱们现在是不是要上传到描中才有啊,所以说还没有先不用写啊,咱们是不是还加个link就够了。
10:03
是不是咱们加一个link就已经足够了,就可以去保存下来我所有的数据了,是不是所有数据呢,加上一个link就够了啊好加保存成功之后呢,我这里就打印输出一下数据保存成功就了,好最后呢,我们看一下待会的数据有没有来拿过来啊。这里面呢,有一大堆数据啊,一大堆数据看一下最后有没有想要我们的。好,是不是最后的所有的数据都已经存下来了,好,都已经存下来了,那么就好办了,那我们就来去最终的保存下来的时候呢,我们去运行一下,看看到底靠不靠谱啊好,这里面做完之后呢,我们接来做下一步我们要save这个我们想要save的东西啊,同样呢,这里要引入这个saves,引入这个方法是不是,然后在这里是不是要调用这个save trade啊好,那我们现在呢,运行一下就能够保存我们的数据了啊方return。
11:03
好,当然呢,这个过程呢,会花费大量的时间,是不是花费大量的时间,当然可能由于网速的限制啊,或者说或者说由于你电脑性能的原因,它可能会稍微慢一些,那这个过程呢,可能需要消耗大量时间,咱们呢就只能等一等了啊啊这一块呢,就是保存数据。
我来说两句