00:00
OK同学们,那么上节课啊,我们讲了这个requests它的一个基本使用对吧?那么接下来呢,我们先干啥呢?我们先把这个yourre lib这个知识点梳理一下,为啥要梳理它呢?因为咱们说过哈,这个lib和request是不是非常像啊,哎,他俩能做一样的事儿,那么我们讲解的知识点会不会有什么区别呢?OK同学们,那么我们接下来就通过梳理这个UR力这个知识点来映射一下request的知识点,它俩基本上是一样的。好,同学们,那么在这儿啊,我们先创建一个文件,哎,给它命一个名对吧?然后呢,我们把URL lib咋的给它写一遍,这个列,这个支点给它列出来,然后呢,紧接着我们再对比一下request啊同学们好,在这啊,写个URL lib,那我们都讲了啥呢?对吧,我们都讲了啥,都做了哪些案例呢?那么在这儿啊,同学们,我们就给他一步一步的给他写出大的方向啊,大的方向第一个我们讲解了啥呀,哎,就是在请求方向上啊,我们讲了一个类型以及六个方法,哎,这是UR力我们第一个写的,那第二个我们大的方向上讲的是啥呢?叫做get请求,对吧,各位,哎,Get请,但是这里边啊,其实我们在概警这讲了两个,一个叫qui,一个叫you are in code,为啥呢?它为啥讲它呢?是不是因为我们就识别不了它这个中文呢?
01:41
他是不是要进行一次编码,那我记得当时呢,我们在讲的时候啊,我会给大家说了啊,这个为什么会有这个这个编码啊,从最开始的ask码到UNO的编码,诶,它的一个演变的过程啊,那么这个讲完了之后,同学们我们讲的是啥呀。我们讲的是不是POS的请求啊,那POS请求当时我们讲的是什么?是不是百度翻译对吧?各位哎,Po请求大的方向是这样的啊,然后紧接着呢,为了让咱们同学更加明白啥呢?关于请求接口这个概念,就是你怎么去抓抓这个接口对吧?所以说呢,我就给大家讲了一个阿贾克斯的盖请求,其实啊,它也可以被列为啥呀,被列为这个盖请求也可以啊,这问题不大。
02:31
就是普,就是阿贾克斯的概请求,和普通的概请求没多大区别啊,然后紧接着我们讲的是啥呀,叫阿贾克斯的post请求对不对?哎,那么再之后我们讲了啥呀。咱把那个异常啥暂时不算哈,那个都是小的知识点,我们大的方向上,我们接下来讲的是哭K登陆啊,那哭黑登录指的是啥呀,同学们指的就是是不是我们绕过登录,然后进入到某一个假如说这个个人信息页面或者主页面等等等等啊对吧?诶酷威登录当时我们举的是啥呀,是不是微博对吧?各位好,那这个再完事之后呢,我们就写的是啥了,叫代理,我们通过handle是吧?诶通过handler,然后呢,使用这个handler process啊来实现的这个代理,当时呢,我们还使用了一个快代理,因为我们知道哈,这种免费代理可能并不是那么的好用,所以呢,我们使用了快代理啊同学们,OK,那这就是大的方向上,我们UR lib使用的这个知识点,那么我们为了做一个对比requests,它的知识点又是啥呢?
03:44
得聊一聊对吧,那么第一个它的知识点一样的啊,是一个类型以及六个,大家注意啊,此时它就不是方法了,它是什么呀,它是六个属性啊,六个属性OK,那在这我们写上,那么第二个我们在request里边,你看呢,同学们它是不是都是get的请求啊。
04:11
对吧,各位无论是阿贾克斯的还是普通的,那么我们都可以把它理解为叫get请求,这没有任何问题,那么紧接着第三个,那咱们咱们用脚趾头都能想明白我们要讲啥了吧,是不是pose请求,对吧?各位好,那么再紧接着呢,我们也是一样的,我们先讲什么cookie呀,再讲代理,这都可以,但是呢,我在这儿稍微的调整一下顺序,我先讲代理再讲cookie,为啥呢?因为在这儿我需要给大家破解一下验证码,哎,这里边儿加深一下难度啊,验证码。那也因为啥呢?因为如果说呀,你登录的时候,如果你登录页面有验证码,那你就不破解了吗?你就不登录了吗?咱也得登录啊,咱也得因为啥我我们得要他数据对不对?诶所以在这里边呢,给大家在酷开登录这我们做一个比较深入的一个案例啊。
05:09
好同学们,所以说接下来啊,我们要讲一下这个requests里边的第一个啊小案例就是第二个小案例吧,啊就是啥干请求,好同学们,那我们要干啥呢?我们先要还是打开一个网页哈,打开谁呢?打开它在这里边我们检索一下,检索一下北京,嗯,我说过同学们,后边这堆东西是不是都没有啥用了呀?诶是吧,好,这是我们要检索的内容,那这个内容我们应该怎么去访问呢?来直接对他访问肯定不行啊,为啥呢?因为我们是不是需要这个编码问题啊,但这个编码我们使用request次了,它和UD吧,有没有什么区别,这些东西都是我们需要去思考的啊,所以在这呢,我们先先看一看是吧?嗯,先导入一下吧,那导入一下request我们之前不已经安完了吗?导入导入的话,接下来啊,我们要定一个URL,和之前的步骤是一模一样啊。
06:14
那这个ul应该写啥呀,你是不是不应该加WD等于啥呀,等于它呀,我是不是只能要他。对吧,因为那个北京咋的,同学们,那个北京是不是我们需要编码,而你不能直接写在UR这个路径里边,它是会有问题的,对吧,各位哎,所以在这块呢,我们需要特殊的去注意一下,好那么紧接着在这下边我们是不是还有个请求头啊,Hi,我们随便找个地方拿过来呗,对吧,你没有这个hi肯定是不行的嘛。嗯。找一个。在这随便拿一个,那么这个hi同学们我把它粘贴,哎粘贴过来,那么接下来是不是同学们还有一个什么,是不是参数date等于它以字典的形式存在的啊,这里边写成啥WD,然后写成什么叫做北京好同学,那这个玩意儿我们应该咋写呢?对吧?它需不需要编码啊,这些都是需要我们去探讨的,那我告诉各位啊,Requests咱在上节课我们就说过了,它是一个唯一一个非转基因的这么Python一个库啥意思啊?
07:27
它只属于Python,你其他计算机变证语言没有明白吧,各位,那他既然只属于Python,那你是不是就应该能给我们提供一些方便的操作呀?哎,这是他给我们做的啊,那这时我们就看看呗,看可不可以呗,来写上response,我们怎么能通过request发请求来呢?是不是get诶。在这同学们你看哈,这三个参数我需要给大家解释一下,第一个叫URL,这个应该不需要解释太多吧。是不是地址第二个叫PMO,那这个是啥东西呢?我告诉各位啊,它叫做参数。
08:07
哎,叫做参数,而这里边的啥呢,叫KWX,同学们注意啊,它是什么?它是一个字典。啊,是一个字典,我得写上啊,写上第一个URL叫请求资源路径,第二个叫paramo,它是啥叫做参数,第三个叫KWXX,它叫啥呀,我们把它叫做字典,哎,字典,所以说同学们为什么我要在这儿强调它们仨还记得我们的U力的请求对称定制吗?为啥要请求对象定制来着?是不是就因为它的UI open里边它不允许放啊,不许放请求投放对不对?所以它才需要啥呢?请求对象定制,而我们这里边你看第一个URL等于ul,第二个paraise,记住它的啥是什么来着,是参数吧,诶,而且我是不是还没编码啊,难道他连编码都不需要吗?哎,这是我们需要探讨的啊,接下来headers等于ters。
09:21
OK,那么这里边我们就要干啥呀,我记得是不是使用的是response.test来获取里边的内容啊,Contact是不是二进制的T才是啥呀,文本吧啊,这个好像更加简单一些,别着急,同学们,我们一会儿再来总结啊,来走。嗯,我们发现是不是有数据了呀,我们找找吧,有没有关于北京的东西啊,如果北京那几个字要有编码问题,我们干啥来着,是不是respondcoding就可以了,嗯,来找找,诶你看是不是可以了,然后中国什么什么政府网站往上找,北京看到了吧,哎。
10:04
嗯,围绕北京市什么,呃,李委主任开展常委会组成人员联系市联系市人大代表工作等等等等啊对不对,这不就拿到了吗?同学们OK吧,是不是比较简单,那么有同学老师啊,这简单到这样,你能不能帮我总结可以第一个啊,第一个首先注意参数使用para。咋的?哎,传递这是我们第一条啊,第二条我们干啥呀,参数记住了,同学们无需啊URL in扣的编码,哎,它不像之前一样,它不需要编码了,直接能用,还有一个就是很重要的,它不需要请求对象的定制,明白各位哎,不需要请求对象定制,以前我们必须不得干啥呀,需要请求对象定制吗?而此时就不需要了啊,注意。
11:01
还有一个非常非常牛的,也非常非常人性化的一个东西,同学们你猜一下啊,我这个问号可不可以删?可不可以,哎,就这问号可不可以删?你猜一下这我把它删掉,来我再来运行啊,看好不好使啊走你。左发现好像没有什么错误吧,对不对啊来往下看看看看看再滑滑北京百度搜索对不对呀,所以说这里边有个更加神奇的一个东西,就是啥呀,哎是啥请求资源路径中的谁问号,哎,可以加也可以不加,哎这就它的一个小特点,我把在这啊这几个顺序给你写上,记住啊同学们是不是request看起来更加的简单一点呢?诶就是它使用起来更加的方便,不像UR lab里边那个啥呀,它的条条框框那么多啊,不用,所以为为啥呢?因为它本身就属于爬虫,他就是专门做爬虫用的,所以说他帮我们优化了很多东西啊,优化很多东西,这有同学老师,呃,我喜欢request,也有说我喜欢UR live,你爱喜欢啥喜欢啥无所谓,仁者见仁,智者见智,你用哪个都行啊,这个我们不做过多要求啊,你只要能把数据给我采集下来。
12:21
就都OK啊,好,同学们,以上就是我们request的get请求,我把视频暂停一下。
我来说两句