00:00
我刚才我讲了啊,上一节课我说了啊,上节课是这样说的,我说刚才我们讲的所有所有的函数都可以自动的用到。那是不是这样子呢,然后呢,肯定是问题的,我们我们看一下例子啊,通通过例子来说明确实是可以。但是呢,有一个区别。对于来说,只能把轴设置为零,不能把轴设置为为S,就没有轴一。对,但是很多时候你设置周一不错,但很多时候设置周一肯定会错的啊,有时呢,哎,设置周一周一它的结果都一样,但是很多时候你设置周一和周,它结果呢,一个有结果一个是错误的,所以通常情况下我们最考虑什么呢?设置轴为零永远不会错,对吧?哎,不用考虑么多,直接把轴,只要是数,把轴设置为零就对了,或者你不设置word也行啊,没问题啊,哎,我们看一下。我们的。啊,这些都是规律啊,大家说了啊,一般把它设置为零或者不设置不行啊。不要再去来做什么东西的话,再去记一些东西,不用记啊,就是按照语来的情况下,默认要要等于零就可以了,这样的话就可以解决所有的,我们的目的是解决问题,而不是说然后记很多稀奇古怪的问西,对吧,需要记那些稀奇古怪的东西,然后NP。
01:07
第2RANDOM random,我们创建一个英为的insurance,然后呢,我们说是从负12~11到十这样子的结果啊。然运行,然后这这个就是什么呢?这就是我们的个一个数据的,然后呢,它呢,我们先看它外形啊这样的内容,看它这个内容,具体内容等于这这么多,然后下面的话,比如说诶先用啊用我们那个S函数。啊,萨姆啊,M和SD这三个函数。复制。然后呢,拦截。比如我说呢,它那个轴的话经不写,我不写了。要么多点,要么都不写。然后呢,这个地方呢不行,这个呢是呃,我们的一个,然后要么不行,要么就是这个字形。式说了算啊,这个就是S啊,我们比如。
02:02
就是我们说的,我们看一下它的结果。还要考三个结果。呃呃求和,呃,这个是求和,然后呢,这个是呃均值,这个是我们的率,然后呢,你相应的可以算一下对吧,我们把S1的话改成一个什么呢?Sum,然后括号我们算一个吧,S。S1有,然后呢,写个脱离这样子看行不行。啊,不行了,再再说吧。你看一。对吧,不用管他肯定是算错的啊,就是我们说的。这个东西。啊,这就是我们说的这个,呃,Serious啊,Serious用这三个函数啊,啊,这三个函数都是没有问题的啊这里面呢,通常把轴设置为零好吧,然后呢,我们再看一下呃,另外的三函数。Mark啊,来看另外一条函数啊,S1。S261对吧,然后呢,我们说是I DX I DX max这个呢,呃,就是不用设轴了,设数轴这个的话,设轴零,一,它都结果都是一样的,这个可以设置为一啊,上面三个设为一的话可能错,那这个呢,可以设置为一,可以设置为零啊都无所谓,你设置为一也行,设置为也行。
03:17
但是的话没有必要啊,没有们么麻烦啊,那太麻烦了,我们就是直接这样写就行了,然后呢把它复制,然后呢,呃,就是就按照我们的就是646为零,四为一,它访应结果是一样的啊,不管四度为零啊,轴四度为零还是轴四度为一,它们的返回结果就是不变的,然后呢,必要去有那么复杂,我们直接就填就行了啊ID,然后呢,这个时候的话,返回最大值和最小值对应的说也就行了,我们看最大值对应是谁呀。是八就是九,那最小值所定的,所以值是多少呢?负11就是五。就这样子一点再发,结束。啊,别来这S压六零。好吧,哎,这就是很简单的一个东西。啊,这就是ix maxx好,就是我们这个东西,呃,当然我们也有一个,呃,你可以用它来算这个的话,我们可以呃。
04:11
所以说一下啊,就是说呃,1261对吧,嗯,有东西啊S有看也看不到括号啊,当然它也有我们说那个啊,S261。都是一样的,然后呢,运行看结果看看。是不是两个都可以,然后呢,你在底下可以算一下口算一下啊,没有问题的,我他算没问题,也就说后面是零啊,因为第三个开始有零了。所以说呢,延迟嘛,零乘以任何数定零。啊,你在底下可以算一算啊,这都不难的啊,口算一下,所以说呢,我们上面讲的函数都可以自动制发的,用到S上毫无违根感,没有问题。接下来的话,我们看一下。
05:02
最后函数函数。函数我们看一下这里面呢,我们呢,只讲数据,这个数据框有义,然后也可以用这个函数,但是没有必要啊,可以用也可以用啊,我们就也可以用,后边可以演示一下,但是我们呢,几乎的话都是数据框敞。然后我们下面来看一下。好,我们用一个比较复杂的啊,就是这个数据的话,数据框啊,它不单有数值性数据,还有输不出来,然后呢,哎,用一个比较复杂的结果,然后这样子啊,我们就这样子去设置它啊,我们看一下如何设置它呢,就是说呢,我们用FR。应该是。62吧,62吧63吧63再发63等于一个PD点六。Date frame然括号,然后呢,里边的话,我们字典来创建,我们就忘了啊,用字典来创建一个数据框,不忘记来用字典字,用字典创建数据框的话,呃,用的比较多啊,很多时候的话,我们就是用一个字典来创建一个数据框的,好吧,嗯,然后呢,这个就是对应的一个我们说的一个什么列表啊,哎,就是我说这里该是abcd吧,我们这样写吧,Abcd比较方便一点意思括号的一个abcd啊,大写的abcd好这样子一个,然后呢,呃,接下来。
06:34
用完以后呢,哎,我们用逗号啊,再用一个A也是年龄啊年龄,然后呢,一个冒号,然后这里面的话,我们用一个,哎,数字啊,看数字啊,102107109101这样。就这样子好,我们说这样就是一个呃年龄好这是一个名字好就是一个特殊数据方,哎,它是有租串包含租串的,那么它的类型的话,我们可以看到啊,它类型是不一样的,我们看一下啊,我们讲过数据框类型怎么确定啊,别忘掉F263类型怎么查阅啊,对吧等X。
07:12
然后呢,他可以允许每一类的数据类型都不一样。看到没有啊,这个要不要忘掉,哎,然后这个时候的话,我们用第函数好。我们如何用块行呢?哎,直接把disc discover函数作为我们的方法函数,作为这个数据框的方函数来使用复制,然后呢,粘贴。出来。推出的话,我们看看它的结果啊,我们什么不在啊,什么没有直接这样来一下,我们看下,他反正只是A年龄啊,这个年龄啊,那么另一列他们统计了,另一列他没有统计,它是统计年龄证明的话,如果你不设置参数的话,它只会对数据性数据进行统计,对我们的支付性数据不进行统计,这样是不对的,但是我们可以看一下啊,不是不对啊,是少了东西,那我们可以看到啊,它只对数值性数据的年龄进行一个呃统计,然后呢,这个count表示的意思是什么呢?
08:04
表示的什么意思?表示的这一列中,这一列中总共有四个有效数据,如果这里面呢,我们改一个,改一个什么呢?改一个空值的话,它只有三个。知道吧,哎,这容呢,如果三个啊这呢我们就不改了啊,就说这有四个有效速度。然A级的四,然后呢,我们看它的平均值。呃,平均值跟一个,呃,就是说呢,就是这一列中的平均值。这样的有那个。年龄和他这个什么呢。每天走的步数吧,是人一样走的步数,可这样理解啊,走的步数哈,这样一个小例子啊,然后呢就是年龄,然后呢,这个是steps走的步数,然后呢,这个呢,也是用的那个控制,然后呢,呃,都是。啊,这样子,呃,1000步。呃,1200步,900步还有万部。
09:01
这个结果的话,就是把。把数据框呢做的更多了一点,好这样子我们看一下它的结果。就有它是把数值性的用来,你看到没有,有四个,这一列有四个,然后呢,这个也是它的平均值,然后这个偏差啊,标准差我们讲过啊,这一列标准差,然后这是这一列的P小值啊,它的A比较值是900,它的一列小值是110,然后下面是什么呢?是四个分位数啊,第一分位数,第二分位数,第三分位数和最大值,那么什么叫分位数呢?我们后期会讲啊呃,你现在想学的话,自己自学去吧啊,我现在不讲。分分位数啊,第一分位数,第二分位数,第三分位数怎么算的,怎么计算的分位数啊,第二分就占到50%的分位数的话,要多位数啊,这个的话我们现在不讲啊,到以后的话,我们首先大家讲啊,分为数大概什么意思啊呃,以后再说,然后呢,我们可以看到哈,他整个是把数值性数据经分析了,但是是不清数据没有分析,四种情况下,我们呢怎么办呢?我们呢给他这样改一改,就是不是改一改吧,加一个参数叫音。
10:04
科普就是科普。加数等于一个。参数运行这种情况下,我们看到啊,哎呀都有了年龄问题,后边还有很多。Account unique top和frequency啊,这个是什么呢?它这个是有效数据四个,然后呢,唯一性有四个,然后唯性的话,它这里边没有,它不统一唯一性,它统计统计唯一性,就是他们有有多少唯一性,因为它是S串啊统计统计唯性,然后top,那么这就是说呢,在排序上最上面的A来啊排序,然后frequency每一个。出现次数。啊,每个出现次数,就是说每一个字母,每一个名字出现次数,然后这里面如果我们给它改一改的话,它肯定是不一样的,我们看一下啊。来看一下这样子AECCD,然后这个的话,那么它就是不一样的,这个时候的话结果。有不样了。
11:00
然后呢,我们看到这个里面的话。2TOP是C啥意思啊?呃,就是说呢,这个不是排序啊,这个是说,呃,可以说是出现次数率多的是C,然后出现几次啊两次啊,要这样理解啊,刚才我说错了啊,Top不是排序样东西啊,Top是指。重数啊,这些个重数。啊,什么叫从后期来讲,就他刺会多。小哪一个,呃,Top肯定是纵数啊纵数哎,就是时呢,所谓纵数指的并不是说呢,它这个数本身大小,因为有时候呢,呃,这纵数指的是字串,就是指就是一个字符,还有一个数字,还有一个字符,还有个轴符串在一列中出现次数。最多的一个次数。啊,出现最多的那个是符串,那个数字就称为中数,这里面呢,出现最多的是谁啊,是C,然后出现几次两次,然后它就是中。你可能用三个项目,三个微信啊,不说了啊,就三个微信,然后这样的话通过include哦,然后我们就是说就是可以统一登记啊,这个的话我们很少用,你们在数据分析中呢啊,很少把植出来也拿来统计非常早非常早,所以说呢,有时候的话不太一样啊,我跟大家说啊,我以前搞统计学,搞数据分析都用的二言。
12:09
或者C加加很少有Python,二爷呢,也有类似东西啊,一模一样差不多,但是呢,呃,近近几年来看的话,二爷越来越被Python干掉,有啥意思啊,Python越来越先进了,越来越越来越好了啊,这个的话有办法啊,就是说呢而言呢,有他的东西更加浓厚的东西,然后呢,我是从2017年开始学Python,以前我都会的。会拍摄的,但是你学R言拍摄很快,你学C加加拍摄也是非常快的啊,非常快捷啊,然后这里呢,老师知道啊,这里面要知道我们呢,呃,一凹的话,他会把它送就行了哈。呃,把数值型的一个,呃,好有这个支部型的都给你返回啊,就支付型数据统计和支部性数据和数值性数据统计的结果都会被返回,就top值是重数,这top重数的quency接是重数的频次啊,重数的频数,我们讲频数啊,频数你们讲过的啊,后期讲频数啊,频数就是重数,频数什么意思呢?就是个重数,虽然它出现最多啊,我不说了吗,就是在一列中出现次数次数最多的那个字特这个数值被称为重数,那么到底出现几次呢?可以通过它的一个频数来描述啊,就这意思啊,然后呢,我们这里边呢,还可以这样做,我们说哎,我不想要啊,我们只想只想要什么呢。
13:20
我只想要。Op的,我只想要做出的统计结果啊,我不想要数度的统计结果,我只想要内部的统计结果的话呢,也有也有办法就是用NP点。为什么这样,我们看一下刚才我讲了。细看。数据类型,哎,我把它数据类型现里。这样。你看到没有,它所形成OK,哎就说呢,我这里面写的意思是我只看支付串数据的统计结果。是不串不串数据的统一结果。啊,这个里一个就可以了,但是如果你要是只看的话,你可以默认的就可以按填,你可以写一个NP点。
14:07
就可以也是结果也是只有数值的都可以啊。你可以默认,你可以自己设置默认的结果的话,一般情况下只返回数字性结果。就是数据本身是数据性数据,这个呢,我们看一下number对吧,这个呢,跟默认是一样的,它先默认的,默认是一样的,你看。还是一样,它只返回数值性数据的统计结果,这就是我们的函数。好吧,哎,好,我们就是先讲到这里啊,我们休息一下,待会儿再急着。
我来说两句