00:00
OK,同学们,那么上节课呀,我们讲了这个,我们为啥用STEM对吧,那接下来我们就要讲啥了,怎么去用对吧?诶怎么去安装,怎么去使用,所以说接下来我们的一个小模块讲的是啥呢?说如何安装liing,以及它的一个基本使用步骤啊,这是我们想想做的,那有同学说老师你这安装还很难吗?还很费劲吗?啊其实还好还好,为啥呢?因为你现在想想啊,你要使用驱动一个驱动去驱动一个真实浏览器,这没问题吧,同学们,所以说你第一步就应该干啥呀,下载一个你想的使用的那个浏览器的驱动,诶在这儿呢,我有一个我们使用的是come浏览器啊,Google浏览器在这儿呢,有一个啥呀,有一个它驱动地址的一个下载。诶在这里边,诶下载路径啊,这里边随便有,那你说老师我到底下载哪一个呀?你这个里边东西太多了,对吧?你咋办呢?接下来我们要看一下啊,说如何查看你的可浏览器的版本呢?你在这儿来点击它有一个啥呀,有一个帮助,帮助之后有个关于,诶在这里边我是92.0版本,后边的小版本不需要注意啊,后边小版本不需要注意,所以说我就得干啥呀,下载92.0的,这九二点几都可以啊,都可以,还有一个就是九三的也行,它是向下兼容的啊,下兼容你只要下下载九二或者九三都可以啊,当然还是和你这个浏览器相关啊,浏览器相关,那我们就点一下吧,点谁都行啊,下载的是谁呢?你是什么操作系统啊。
01:44
对吧,你这里边有这几个操作系统,那么有Windows,有的同学说我64的不不需要啊,这WIN32就行啊,WIN32就点它,哎,它就从这下载了,不需要就是不需要给一会儿啊,我们用完之后,我我告诉大家怎么去做,当然这里边呢,同学们你要注意啊,它还有一个是谷歌驱动和浏览器版本之间映射表啊,你在网上去查呀,也有很多是这样的,但是他现在没有多大用,为什么呢?因为他现在的这个呃太版本都太低了啊,版本太低了,像二五啊什么什么之类的,最新的都22.46对不对,它支持的是70几,但现在呢,我们版本大家看是不是都90几了,大家看到是不是都90几了,所以在这儿呢,需要注意啊,好同学们,我们下载完了,下载完之后呢,我给它干啥呀,我给它剪切到桌面,我告诉大家怎么去用哈。
02:37
剪切到桌面,剪切到桌面之后呢,它是一个zip文件,对吧,你给他解压一下看出现了啥。啊,是不是出现了一个点exe的文件呢?大家注意啊,当你解压缩之后变成了一个exe文件,你就不要再去动了,你给他干啥呢?你给它放在你的这个目录下,第一层级放在目录下。
03:02
哎,然后呢,就放在这儿就行,OK啊,先放在这儿,同学们注意啊,这个exe文件不需要你去安装,不需要你去运行,千万要注意。那这完事之后呢,我们接下来干啥呢?又是安装一下斯Li宁姆,因为sli宁姆在默认的Python的环境中是没有的啊,所以说在这儿同学们你要注意啊,咋的我们需要安装一下C00,那么现在呢,我们来打开一下它啊,还是一样啊,切换到E盘CD到Python中,然后CD到scripts里边。嗯,好嘞,在这里边呢,我们紧接着pape into啊,Sliing啊,一定要按一下啊,然后杠IHTTPS冒斜线,然后PYPI,点豆瓣点com。Simple,哎,这就可以安装成功了,大家稍等那就可以了啊OK,你安装完了,安装完了我们的这个驱动也下载好了,接下来我们是不是就要去应用它了,好同学们,那么接下来呀,我们创建一个新的文件。
04:10
来使用一下这个sliium,然后是上硅谷爬虫sliium,然后啥呀,这个我们把它叫做基本使用啊,基本使用OK,那我们要干啥呢?我们要用它来驱动一个真实的浏览器,对吧?那么使用步骤第一步你要用它,你是不是得导入一下呀,同学们你必须得导入啊,你不导入肯定是不行嘛,对吧?所以在这from from谁呀,From c linu,当然呢,这里边你要没导入,没有安装完之后它是没有的啊import import导入的叫web driver,哎,导入完了,那导入完之后这是啥呢?第一个写个小注释啊,它叫做导入cliium,导入完之后第一步第二步要干啥呀?第二步我们是不是还有个驱动没用上呢,是不是,哎,是不。
05:11
没有驱动用上呢,那么接下来啊,这个是啥呢?这是创建。创建啥呀?创建浏览器操作对象啊,创建浏览器来操作对象,那这个第一个有个pass pass里边的值同学们注意啊,它写的是驱动的啥呀,路径啊,驱动文件的路径,那我们在当前是不是就Ome.driver啊,哎,可以的啊好,紧接着大家注意啊,创建浏览器browse啊,这浏览器的意思啊,等于啥,等于web driver.chrome你现在,但是你看啊,有安卓的,有黑莓的,有Chrome的,有什么EEDGE的是吧,有有什么火狐的IE等等,Opera什么什么是不是很多很多呀,而我们现在你下载的是不是可入的这个浏览器的驱动啊,所以在这里边你要写啥呀,写上一个pass。
06:07
好,这就出给对象,那这个对象要这个浏览器要干啥呀,同学们。你是不是要驱动一个真实浏览器去访问某一个网址啊,所以说第三步啊,我们要写上叫访问网址啊,或者访问网站都可以,那访问网站呢,这个给他一个第三啊三,那么紧接着在这我们要定义一个URL,你要访问谁呀?访问个百度吧,HTTPS冒号先3W点百度点com。对吧,或者访问访问京东一会我们都可以啊,咱们先用,用完之后呢,我们再讲里边的东西,那咋咋打开呢,直接就是browse点,同学们注意get。啊,写上ul就行了,那这样的运行你看哈,导入,然后创建对象,这是真实的浏览器对象了,啊,那真实浏览器就要打开一个网址了,同学们,这个思路还够清晰吧,OK啊好,那现在我来运行一下,你看会发生什么,走你等待,哎,允许一下。
07:12
咋的了?哎,同学们,你看他说正受到自动测试软件的控制,怎么了,我一运行为啥会发生这个东西呢?来运行,我没有点点别的,我手已经离开了键盘走。他是不是打开了一个新的网页啊。对吧,而且还能干啥呀,真正的打开这个网站吧。对不对啊,那这样的话,他驱动了真实浏览器,那你还怕他不给我们数据吗。明白吗?各位诶所以说在这呢,我们诶可以这么基本使用一下那个同学老师,那这个我也没看到有多好啊好同学们你把它改为京东试试,来京东的网址,我们把把这拿过来。
08:01
就是它对吧,京东网址那拿到这儿,然后呢,我们现在再写上一个browse.get URL,看能不能打开啊走。好同学们,他打开没打开呀,完全没有问题吧,是不是各位所以说在这里边儿呢,他可以干啥呀,他可以来打开京东,那又能咋样呢?难道他就能给你数据吗。对吧,各位,所以在这里边呢,我们就要干啥呀,就要看一下能不能给我们数据来content等于browse点叫page source,来打印一下content,同学们注意啊,我这个先大家不用去掌握太多,这个page source是啥呢?获取网页源码啊,它是获取网页源码,我看一下这个源码中有没有那个玩意儿啊走来运行它。嗯,好运完了,运完之后呢,我们给它关闭掉吧,在这儿确实给我们打印了一堆东西啊,那么这里边儿它有没有那个啥呀,有没有这个秒杀的东西呢?来我们右键检查,然后在这里边有个什么来着,叫JCQ是吧,那么现在我们在这儿CTRLF来走你同学们你看这嘎写着叫one match,那你看没看到我们检索的数据啊。
09:29
OK,不喂,为啥他可以这样呢?因为京东检测你啊,原来你是一个真实的浏览器啊,那你是真实浏览器,我就给你数据呗。你如果说真实浏览器它都没给你数据,那它存在的意义又在哪儿呢?明白吗?各位,诶这就是啥呀,这就是我们cli的一个好处,Cli的一个作用,好同学们,以上就是给大家讲的一个啥呀,它的一个基本操作啊,以及安装好我把视频暂停一下。
我来说两句