00:00
OK,同学们,那么接下来啊,我们再做一个关于post请求的一个案例啊,一呢是为了让大家更加熟悉post请求的时候,我们如何去处理,二呢,就是我们要即将要面对我们的第二个反扒的手段啊,第二个反查手段,所以说才讲这样一个案例啊,大家就知道哈,我们的百度翻译呢,其实很多同学如果要没有细致的学习过,那你应该不知道,其实百度翻译还有一个啥呀,叫做详细翻译,我们来找一下啊百度翻译。啊,检着它这里边的接口中啊来看一下叫中啊找他啊,它这个里边啊有一个翻译叫做啥呢?叫做详细翻译,何为详细翻译呢?就是它翻译出来的结果要比我们正常翻译出来的更多,我们称之为详细翻译,假如说这个我们要再打一个啥呢?打一个这个love是吧?哎,打love。
01:05
OK,同学们,那么在这里边啊,我们去找啊,啊这个Su我们现在都知道了,它是个啥呀,它是一个普通的一个翻译,对吧?看一下诶是love,然后呢,在这是一个POS请求还是sug这样一个接口,它是一个普通翻译,我们也看到了爱热爱什么等等response这点大家可以关注一下它的这个滚动条,那么有同学老师啊,这个详细翻译是啥呢?大家我大家找一找哈,这里边其实呃,如果你要之前没找过的话,不是很好去看,我告诉各位是谁呢。这里边有个叫V2TRANS API在这样一个接口,它是一个啥?大家看现在的滚动条是不是少了很多很多东西啊,对吧?而这个就是百度翻译的一个详细翻译啊,百度翻译的一个详细翻译,那么一会儿呢,我们就能看到它对应的数据啊,我们来找一下诶,它是这样的,这一个接口还是一个POS请求,然后呢,在这儿它的参数同学们看是不是就变多了,跟之前是不是不一样的。
02:12
对吧,各位,所以说这个案例我们讲的是啥呢?大家再次熟悉POS请求的流程。这是其一,其二它还有一个啥呀,还有一个反扒手段啊,我们先来一个写写啊,在这儿来创建一下子啊,创建一个新的文件啊,把这个名拿过来。嗯,然后呢,在这儿创建一个新的文件来战舰叫060是啥呀,也是破,请求百度翻译之啊之。详细翻译啊详细翻译,那么在这呢,我们要知道哈,还要这些数据,所以说你要导呗,嗯,URL lib点儿request好完事了,那么现在呢,我们先找一下接这个接口啊,接口就是它。
03:05
你是谁呢,这个。啊,这个,然后紧接着粘贴过来,接口hier要不要hier是不是肯定得要啊,请求头嘛,对吧,Hier复制过来,诶粘贴到这里,好,接下来要有一个东西啊,叫做啥呢?叫做参数,对吧,我们这个参数里边它还是要给他一个date,哪去了这一堆东西啊,这个都是它的参数啊,都是它的参数,所以在这写个date date里边的东西是不是很多呀,这些个。那这个我们是不是要每一个都给它加上一个引号啊,诶对吧,每一个都要给它加引号,但这个呢,我们可以借助一些其他的工具的啊,借助一些其他工具的,就啥工具呢?嗯,同学们看啊,这个后期我会传给大家的,就这里边有个plus啊,它特别好用。嗯,粘贴过来,嗯。粘贴过来之后呢,它现在前面有一些空格啊,我都给它缩进一下,嗯,这都不要了,就不要了,然后在这呢,大家注意啊,我要按住CTRL加H,然后选择啥呢?正则表达式,后期我们会约一些正则的东西啊,然后第一个我们给他按照群组来分,第二个用这一和二,然后点击全部替换,同学们看是不是前面都给你加了一个引号啊,对不对呀,哎,但是同学老师你这个用工具这么快,我不用工具行不行,一个个加行不行,没问题啊,你只要想加就加,无所谓啊,无所谓,好同学们我把它复制一下,给它粘贴过来,嗯,OK了。
04:38
好,这就是我们参数都加上一个引号了啊,那么按照我们之前的写法啊,POS请求参数必须要进行编码,而且我是不是还要调音扣的。没毛病吧各位,诶,所以说在这里边啥date等于记住啊,这写上说post请求的参数必须进行编码,并且要调用in扣的方法啊,所以这里边写啥呀,诶pass是不是没有呢?我得导一下啊,哎,这个你要用啥就咱就倒啥哈,Pass。
05:20
哪怕,那来来,写上ul力吧,点。pass.ul incode,传个data这个编码之后,是不是紧接着我必须要进行incode方法呀?你这个不行的话,你在访问的时候是不是有问题了?好,OK,那这个完事之后,紧接着我们要做啥呀?我们是不是要做请求对象的定制啊,对吧?来写上来请求对象的定制啊,请求对象定制咋定制来着?Request等于your lib点儿request,点大的request里边是不是有三个参数,URL等于UR date等于date headers等于headers,嗯,OK,请求对象定制。
06:17
那定制完之后接下来干啥呀?嗯,接下来是不是要模拟浏览器向服务器啊发送请求啊,对吧?各位,那在这边来呗,Response等于啥your leave.request.url open里边传一个request是不是就OK了啊,所以说大家注意啊,这就这几步啊,没有说特别复杂地方,就这几步,那一会让我们再来封装封装是吧,写几个小函数来试试,嗯,好,同学们进来那干啥呀?获取相应的数据啊,获取响应的数据,那这里边写啥呀?Content等于response.read.decode然后来写上一个utf杠八来打印一下啊,打印一下看可不可以啊,同学们来运行一下走。
07:13
嗯,怎么就这点儿数据呢。对不对,什么error message,那我先干啥呀,我先看一下吧,他这个对不对,这这点数据我也看不懂啊,咱说了之前是不是可以用杰森来的啊,杰森然后咋的了,OB勾等于杰森点lose,然后来写个啥呀,Content来打印一下,这是不是我们的数据呢?但是我感觉你这不详细翻译,你不应该多点吗?怎么就这点儿是吧,来走诶未知错误完了废了,你根本就不对呀,对吧?好同学们,我刚才在讲课之前我就说了第一个。哎,我们来熟悉一下POS的请求流程,第二个我们是不是要有个啥呀,有个反扒来着。
08:00
哎,这里边他没有给你数据,那为啥没有给你数据呢?这不就是跟搞对象一样吗?你跟一个女生说我喜欢你,这个女生不同意,他不同意绝对是啥呀,他想要的你没有给他。对吧,各位,那这里边儿他到底想要谁呢?同学们注意啊,他想要谁完全取决于这里边儿有一个非常重要的东西,叫做请求投。这个请求头上边这个东西是啥?是你在真实浏览器中,真实浏览器中它携带过去的参数。如果这个女生想要的你全给他了,那他会不给你数据吗?要颜值有颜值对吧,要这个个头有个头,要金钱有金钱,要体贴有体贴,那他有啥可不同意的呀。他喜欢你黑你,你也你也得给他,他才能同意吧,对吧,各位,所以在这里边儿这个请求条中的数据,你要都给他就OK了,那都给的话放哪儿啊,就放在我们的hazard中啊,那现在呢,他还是要干啥呢。
09:18
你看你上边的努努力还行,你下边这东西咋加呀,就很费劲是不是,呃,这个CTRLH啊,就全部替换,你看这多方便呢,对吧,叫edit plus edit plus啊ctrl a ctrl c,我给它粘贴到哪里边啊,粘贴到hier里边啊啊粘贴到里边,你看要啥给啥,我就不信他不给你数据对不对,诶你所有的他的诉求都满足了,那那有啥可不同意的呢?所以说这句话怎么说来着啊,只要锄头挥的好,没有挖不倒的墙角,明白吧?哎,所以说同学们,现在我们来运行一下啊。看行不行走嗯,报错了啥玩意报错了这叫啥呀?U条八为啥注意同学们这里边有一个非常非常重要点,就是它接收的编码格式GZ和BR,它有U没有,所以说记住啊,同学们,我们在编在写爬虫的时候,这句话一定要注释掉。
10:23
啊,一定要注视掉来再看走,嗯,看是不是给你了很多很多的数据啊。对吧,很多很多数据,哎,这就可以了,这就可以了,OK吧,各位,但是呢,我要再给各位同学多说几句,这里边到底哪些取决定性因素呢。当看到这个视频的同学啊,一定会有女生,那请问女女性同胞们哈,说如果一个男生追求你,是不是肯定有一个点打动你呀,而不是说所有的点都打动你,那你也太过分了,是不是肯定是有一个点打动你,而这个点起了决定性的作用。
11:06
没毛病吧,各位,那到底这几个哪个是呢?难道是他来运行一下。嗯,不是,难道是他再运行一下。不是,难道是他还是他还是他?再看看好像也不是对吧?那难道是谁呀?难道是他,难道是他他他他他他他他他,我连UA都不要了,看到了吗?各位,这里面谁呀?我就留了一个cookie。来我们运行一下走你诶还是好使的,只要这里边取决定性因素的一个东西叫啥呢?叫做cookie。啊,千万注意啊,这个就是我们刚才在讲课之前说的,他有个啥呀啊,反扒这里边爬的谁呀,就叫做cookie OK吧各位,哎,所以说在这里边这个爬虫啊,其实和搞对象差不太多,无非就是啥呀,你要打动他,你要知道他最终想要的东西是啥,你给他一个这事儿就成了啊,给他一个字成了,当然呢,也有很多其他的网站啥要求的很多,我不仅要cookie,我要UA,我要这个什么referee什么等,很多很多啊,很多很多,好同学们,这个就是百度翻译之详细翻译,那么接下来我把视频暂停一下啊。
我来说两句