00:00
大家去看一下整个它的一个,呃,都包含哪些个功能,那么后续的话,大家去多练一点,然后在项目之中,你去感受一下它这些个功能都有什么样的作用,先第一个叫做选取一行啊,选取一行我们之前说过这个a.lock它是不是按行去写去啊。对吧,大家要行去选取,那么实际上如果我们前面只给一个二啊,我们只给一个二,它是不是能够输出结果,不能啊,来看叫做can't do label on indexing怎么样怎么样,我们先看一下这个A是什么吧,我都忘记了呀,它这个前面这个没有二了,那么所以我们要去找的时候,应该找的是叫做a.log中括号什么引号A吧,或者是B,我们如果找第三个,刚才012是第三个,我们找的是C,那么这样的话,它是能够输出结果的,刚才我以为他这还是1231234来,那么如果是这种情况的话,它可以通过这样的形式,跟这个是一样的内容,那我来写一下,就是C,然后是逗号冒号,逗号冒号来,那么这样的话,就相当于说我们后面给它做了一个切片,实际上在后面你也可以给他做切片,比如说我们找到的是C的这一。
01:22
一行,我们要找C的这一行里边的sex和grade,也就是说性别和性别这是什么玩意儿来着,分数啊,性别到分数,那么性别到分数是不是就应该用的是切片呀?我们就可以用引号S和然后冒号什么引号grade的来看,那么它就会从SEX1直到grade的东西就给我们拿出来了,那么内部是就没了,这就是它的一个切片的作用,那么下面的这一个也可以用lo来做切片,那么ILO做切片的话就是a.ILO中括号,那么ILO必须用的是index。
02:03
那么如果我们想要取的是C这一列方的一,就是二,二的话,来逗号,如果我们依然想要取的是后面这个东西,是不是可以把它拿过来呀,不行,是不是就得用索引了啊,就得用辅引,那么这个地方用辅引的话,这个所以是一啊,我们来看一下是不是一,我们看一下是不是一,一直到grade grade是23456啊。那么23456,我们来看一下23456它是一个什么样的结果啊,是不是应该少一列对吧?少一列我们最后的那一列,因为我们这个如果用索引的话,它是前开后闭的,那么应该给的是T啊,应该那么这个索引啊,这个切片我们大概就知道这那么这种I就做ILO用的是这种,然后ILO用的是这样的一种,然后后面的话应该我们就都有了,刚才我们都实验过了啊,都实验过了,它这一块跟我们目前是不一样的啊,它这块是一,是因为它前面这些是12345,我们这边变成了abcde了吧。
03:04
所以我们要用abcde啊,那么再来叫做过滤查询,那么这个过滤查询实际上跟我们之前是一样来,首先是a.a中括号grade,这是什么?他给我们返回的会是一个什么东西,Serious对不对啊,它实际上给我们返回的是一个serious,对于这个serious我们再给它做一个东西,我们再给它做一个东西,叫做大于60,这样的话是不是就返回一个serious里边全都是触发Co啊,全都是负Co,然后来再看下一个,下一个这种这种我们先来看这个,就先不看运算啊,只看它的a.log那这种。这个返回的是什么?前面只给了一个冒号的意思是指说所有行对吧,所有行取grade的这一列,那么就是grade这一列与上面的这个应该是一样的吧啊,所有的行取grade的这一列,那么与上面的应该就是一样的,然后再去给它做一个,我们先看一下与上面是一样的,然后再去给它做一个大于60的话,那么就是都是true和false的一个there等于大于等于60都行啊,就是我们说的是这个出false啊,那么来这个这个这个值是指说我们把这一堆来看,首先看里边的这个里边的这一个是不是A,然后通过2AGREE,然后大于等于60,它是一个true和false的fairce呀,通过这个true和false的fair,我们能够去过滤这个A,那么也就是说,他会把C的这一列给它干掉了,应该会把C的这一列给它干掉,来看一下就叫过滤查询了,他应该是要把它干掉A。
04:45
Be DEC的这一列就没了,因为C的这一列是false这一个产生的false,所以它可以通过serious去过滤内容,那么同样下面的这个的话,诶,下面这个跟上面这个有什么区别?没区别啊,下面这个跟上面这个没区别,我们也可以把它仿一下,好,那么再来就是叫做木耳索引和切片的一个结合。
05:06
啊或索引和一个切片的结合,我们来看一下这一条,大家觉得它会返回什么啊,返回什么来看它返回的是首先我们来看前面的这一个,前面的这一个是serious对吧。Serious,这是serious,那么后面的这个是什么?后面是切片嘛,后面是说从address往后我们都要,也就是说他需要给的是和dress和great,那么也就是说前面的是切片,不是前面的是过滤,后面的是切片,那么最终返回的效果应该是要几条,你们觉得四条是吧?四条数据。四条数据,为什么?因为grade大于60的总共有四条,对于这四条我们又找它的列,那么它的列做的工作就是获取后面的这两列,那么address和grade,那么这个前面依然是一个serious的那个true和false,然后把false的那一行改掉,下一个叫做多重条件过滤逻辑运算,那么这个就是与或非,那么与或非的话,实际上都是我们的这个呃,逻辑运算,那么它依然是这样来,我们先看前面的这一部分,这一部分返回给我们的是一个serious,对吧?返回一个serious里面是to和false,这个返回的是什么?
06:21
它也是一个serious,我们来看一下啊,河北把它复制过来,那么它返回给我们的也是一个serious,那么这个serious也是true和falses,那么true和boss这边是一个serious,这边是一个serious,他们俩做语应该也是一个true和falses嘛,那我们来看一下,把这边也复制过来就OK啊,这OK,那么这是一个to和false,这是一个to false来看,第一个是false,这个已是to,它返回的是,如果是与操作的话,False第二是to,第二是to,返回的是to,第三个是false,第四个是false,第五个是to,那么应该是返回两个to是都是false。
07:01
我来把整个的来看一下,就是说这个东西是什么呢?这个东西就相当于说我们用serious和serious去做运算,它为什么说这种运算会比较好,是因为我们之前画过图对吧?它的运算方式是指说对于每一个它是并发去运算,也就是说我们series里面,比如说比如说有五个数据,这五个数据它是并发去做计算,比如说这个货上一个下面一个series,下面一个series是不是也是五个数据啊,这五个数据,五个数据,五个数据之间是并发的啊,所以它会这个内容会比较快,那么如果是我们普通的这个列表或者字典的话,它实际上是用循环来做的,循环的话就比这种要慢很多,循环的话它需要做五次,而我们这个需要一次做五个啊,所以这种还是要更快的好,那么这个他给我们返回的应该就是两个数想上都是false,那这个的话就是A里边是做这种来看A里边做这。
08:01
首先他找到的是什么,它是不是就相当于是我们思索语句里面的那个,找到这个表里边grade的大于60,并且S是be谬的那个人的数据吧,对吧,这跟我们最后语序里面是一样的,那么还是说相当于是找到grade的大于等于60,那这个我给大家稍微再说一遍啊,就是找到grade大于等于60,并且FA等于female的那个人,所以这个地方这个东西跟and是我可以把那条语句给大家写一下吧,啊,那条语句写一下,那么写一下的话来,它实际上就是相当于是叫做like。星from a,然后where条件就是叫做大于等于60AND3等于引号female没叫做female没female没有,那么实际上它就等于是这个东西,它的这种过滤就跟我们的这条语句是差不多的,所以如果我们把数据整个的从MYSQ里面获取出来,那么就可以通过这样的方式去过滤出你想要的那个某一个内容啊,我们来看一下他是不是这样子,那么也就是说B的这个人他是female,并且他的gradere大于60 e的这个人他是female,并且他的grade大于60,那么整个就是这样子的一个情况啊,他就跟我们select句是很相近的,呃,然后通过where过滤选取数据,这是什么意思?我们来看啊,他说通过where来过滤选取数据,我们来把它复制过来,把复制。
09:41
出来我们来看,如果是这样的情况,他给我们返回的是什么,是不是它相当于是说把我们的每一列的每一个内容都跟这个60去做对比啊,但是有一个问题就是这个内。这个name它不是一个字,叫做int类型,它是一个object类型吧,Object类型,那么这个object类型它给我们都返回的是to,这个sex它也是一个object类型,Object类型我们说它就是怎么算啊,Object类型,然后age age的话是年龄对吧,年龄大于六次的没有。
10:16
然后身高,身高都是一米几几,就是一几几一几几可以达到60%体重,体重我们来看有两个是大之60的对吧,然后address全都是,因为它也是object,然后grade grade有一个是小于60啊,它会把这些每一条,就每一个数据都跟这个60去做比较啊,每一个数据都不跟60,那么后面的话我们还可以去看A小于30来看A小于30 a小于30我们来看。是也是出对吧,看到没,就是不管它这个它这个内是多大,它只要是object类型,它都给我们返回的是处,包括sex,包括address都是一样的情况,但是还有问题就是age,那么上面的这个age。
11:05
全都是false,下面就已经有是处的了,对吧,有一个是false,然后剩下的这个高度呀,什么呃,成绩啊,这些都是按照我们预想来的,只不过就是一个object全都去处,那么如果用这种情况去做这种过滤来看,如果用A中括号A大于60这种去做过滤,它会给我们返回什么样的情况,你们觉得来我们来看一下吧,如果说它以前是醋啊,如果我们把它变成30吧,小于30,这样能看的更清楚一点啊,两个放到一起,小于30看看,如果以前是处。那么它就会把内容保留,如果以前是boss,它就会把内容变成na啊na na把它想一下是不是一样的呀,对吧?诶,Address,为什么这个地方它会变成,那我们看一下A里边,如果A小于30,这里返回的H是处,为什么它这会是闹,我看一下这个地方写的原来A是什么,原来就是闹,对吧?啊,原来就是闹,我就说不符合我们的逻辑对吧。
12:17
啊,他原来就是呢,那么这个地方我们也能够看出来一个事情,就是那跟我们的这个东西去做比较的时候,他是不是也给我们返回了数呀,啊也给我们反,所以就是除非真的就是数值类型,其他类型它都会给我们反馈数,但是在做过滤的时候,它这个地方就是保持原来不变,所以它就是long对吧,我刚才还在想说这东西怎么会出这么个bug,我以为它出了个bug啊,这块变成那了。原来它原来就是呢,再下,那么就是通过这个where条件去做过滤啊,那么我们依然可以看这一个东西是什么意思,这个我们之前讲过啊,它是不是就是去选取A这个frame里面的三列。
13:01
组成一个新的data frame,对不对?选取A里面的三列组成一个新的data frame,我刚才可以看一下它是什么样子的,叫做d columns,选取A里边的这三列组成一个新的data frame,那么组成这个新的data frame,我们可以去判断它的一个data frame的值,这三列来判断它的值D_D不,那么就是按照我们刚才说的这个,如果是大于60就是true,如果是小于60的就是false,那么由于是object类型,这边全都是true。好,那么我们来看过滤查询这个东西我们之前应该是已经做过了吧?啊,我们来看一下这个东西,大家觉得会返回什么东西啊,这个是不是,这个就相当于是这个把这个东西拿过来,它里边是two false two,然后two false two,然后这些东西two的位置就保持不变,那么也就是说这个40 64和80是保持不变,其他东西。
14:01
都是,那然后这个也是保持不变的这个数,这个保持不变,这个保持不变,这个82保持不变,98保持不变,剩下剩下的这个应该是,那我们来看一下是不是我们预想的结果对吧?那么就是原来是false的地方都变成那啊,原来是false啊,那么最终啊,我们可以去删除有那的去,比如说我们在爬取出来一些数据之后。这些个数据是不是就有可能是缺失的呀,比如说某个球员你就缺失了他的性别,男和女,或者说缺失他的体重,那么如果某一个人缺失了他的体重,而我们又要拿它去做数据分析,是不是就有可能分析的是错的漂,那么分析是错的,那么就我们就需要去对他做处理,那么分析做的需要对它做处理的话,那么这里面就有一个东西去可以做处理啊,我们来看一下这个东西叫做job na,那么na表示就是那啊,Na表示就是那,那么就是我们可以去通过一个data frame去drop掉一个那的值,后面有一个叫做how,叫做怎么样去drop啊,怎么样去drop,如果后面后面可以取两个值,一个叫做any,一个叫做啊,如果是any的话,就是这一行之中如果存在,那它就要删掉,我们来看一下它的结果,是不是就只剩下了一个小青这一行呀?
15:24
剩下的全部都被删掉了,原因就是这一行出现了呢,所以我们就把它删掉了,那么后面这个any也可以把它变成负f ull,那么如果是负的话,它就是。所有的都是,那它才会删掉,我们来看一下,如果是for,它就写错了,那是FUL吗?诶,不知道不知道这个,我记得这个是叫for啊,那么记不住了,我们就百度一下job na,然后panda,我记着是for,但是它没对,就说明我写错了,来看一下how啊,哦,Any和all,我刚才说的是for什么哈,那就是all,我写错了,那么就是all,就是所有的全部都是now,它才会删掉,我们来看一下它一个都没删,那么假如说我们把这个值和这个值。
16:13
啊,这个值和这个值给它变成捺,我们来看一下,就叫做DD,呃,Na,如果我们要去改变小名和grade,如果我们要去改变小名和怎么改啊,怎么改,我想改这两个值,把这一行全部都变成了,我们是不是首先要去取到这个值的内容,那么取到它的话,按行来取就是A,那么按行来取,我们可以这样去做,就是把A取出来,然后给它一个na na na na na的话是用NP.n na啊,这个我们还没学,后面我会呃做到,那么这样是不是可以把它们都复成大呀,可以不来试一下,然后我们再来看一下D,这个值全部都成大,那么还可以说我们对于每一个值,比如说我们把想要把小华变成大行了,就是叫做D。
17:07
na.log中括号引号A,然后逗号引号name等于NP.nab na啊,Bbb啊,我们要小华是吧啊,B是吧?那么这个就是我们把之前学过的东西来做一下,那么我没听到你们的声音,我估计就是你们现在还非常不太熟啊,还不知道要怎么做,就是我们这个东西讲过吧啊,在前面讲过,怎么样去给他做赋值啊。那么这样的话,我们就能够把它赋值了,哎,如果我们赋值之后,我们再用drop na啊,再用drop na来看一下how等于二,那么它会把哪一列照照顾掉,每哪一行照顾掉,是不是把A这一行照顾掉呀,来看一下是不是这个样子,A这一行就没有了,所以就是drop now的这个值我们后续可能会用啊,因为呃,如果里面有now值的话,那你说这一行其实压根就一点用都没有,直接删掉就删掉就可以了,好,那么后续我们还能够渠到的是说,如果这里边有纳值,我们要给它做一个纳值的一个默认值,要怎么去做,这些后面都会有,我们现在先不讲啊,一会到了那个地方啊,诶,我们还没讲过修改,我怎么继续讲过了啊,我怎么印象里边讲过呢?来先看这个叫做is in啊,Is in,那么这个is in是什么意思,就是说我们可以通过这种方式去做这种is in,我们来把它拿过来啊,我们来把它拿过来看一下,这是C。
18:39
对这种is in,我们来看一下,它是不是给我返回true false false true false呀,那么这个东西其实跟我们的那个。是不L语句很相近啊,对吧,它实际上这个Soo语句就是叫做from a,然后where条件是叫做address in括号,括号里面是北京海淀和深圳南厦吧,哎,我们把这一讲的时候跟他做这做好对应的话,大家可能呃既能了解一下这个最后语句,能了解一下我们这个,好我们来看一下。
19:14
就是这条语句跟这条语句很相近,什么意思?就是我们去找address是不是在北京海淀和深圳南山这两个数值之一,如果是的话,那么它就返回处,如果不是的话,它就返回false,这是不是返回给我们一个serious呀?那么就是address这样,其实我们这个东西,哎,我之前讲过,V条件里边它也是一条一条过来去做的,也就是说A里边的内容,比如说A里边有address是北京什么海淀,有什么深圳南山,它是不是也是一条一条过来去做的呀,对于这一条他会给我们返回一个true或者false,那么对于这一条先这什么什么也是这一条过来去做where条件,他也会给我们返回一个true或者是false,然后根据如果是true我们就保留这一条,如果是false我们就不保留这一条,那么这种情况就跟下面的这个是一样的,我们来看一下下面这种情况,C controlr v,那么这种情况的话,它应该就是把是北京海淀和深圳南山的东西给我弄出来了,那么其实这个东西就相当于是S语句叫什么?S语句like像from叫做。
20:34
A,然后where条件就是address in什么,对吧?其实这个就跟这种是一个意思,就是你去找address,它要不然就是北京海淀,要不然就是深圳南山,那么这种in is in其实我们也可以,哎,就是当我们知道它是in的时候,我们是不是也可以给它用or来做替换,用or来做替换,用or来做替用or来为大家写一下啊,怎么样去用or来去做替换,那么整个这一个值,其实它就相当于是A中括号。
21:11
引号叫做address,然后等于等于引号北京海淀,我来写一下北,北京海淀,然后是叫做或者A中括号引号address,然后叫做等于等于引号叫做深圳南山对吧,深圳南山,那么这个值我们来看一下,跑一下跟它是不是一样的啊哦,看一下叫做can't compare a d typeed area with ake of type of来看啊。我们找的是A的address,这一列是不是等于北京海淀?来看一下,我们看一下A是什么啊,难道是我写错了吗?AA是这个东西,我们找A的address是不是等于O,明白了,先把括号写,把括号写,那么这个东西就涉及到说我们需要把括号给它加上来看,那么这一块我们把这一行删掉吧,这个东西没用,我删掉来对比一下是不是一样的true true false false false false true true false,那么上面的这一条就相当于是下面的这一条,什么意思?就是如果等于北京海淀或者是等于北京南山都可以,所以用货对不对啊,是货,那么这一条来跟大家说,这一条写成最后一句可以什么样,是不是就是from,把address也改成all条件就行了,Address等于引号叫做北北京海淀,然后是all什么呀,Address。
22:49
等于引号叫做深圳来山,OK,那么这个就相当于是这个,但是他们俩同一个意思啊,就是啊,它们俩是同一个意思啊,就是这个,这条语句和这条语句是同一个意思,那么这条语句和这条语句它也是同一,所以我们用哪一种都可以。
我来说两句