00:00
那么这道题就是看好啊,这个题是是一个很经典的题啊,将来我们会用到这个题里边的思想叫做说我们想要知道,想知道叫做中国啊,中国是不是有30%的国家都连入了互联网啊,是不是有30%的家庭,家庭都连入了互联网,30%,那么就是收集了,叫做收集了一个样本,收集样本,那么收集这个样本发现150个家庭啊,150个家庭,那么这150个家庭里边有57个进入了,你不要按北京来算啊,其实北京是有这么多,但是你可能说村里边或者什么的,有可能就没有啊,有很多家可能就没有啊,这是很正常,那么我们说显著性水平啊,显著性水平,显著性水平是5%啊,显著性水平是5%啊。我们来看一下我们。
01:00
那怎么样去做这个事情,显著水平水平你们可能不知道,但是我们依然能够去通过我们的这种叫做叫做叫做计算给大家去说出来这个显著性水平啊,首先第一个先说显著性水平到底是一个什么样的作用,就是我们想要去研究的是一个叫做家庭有没有接入到互联网的这样的一个内容,假设说我们认为说有,就是中国有30%的家庭接入了互联网啊,或者说没有30%的家庭接入互联网,我们先说没有吧。没有30%的家庭进入互联网,那么它没有的这种概率是不是应该一个正态分布呀,那么这个正态分布里面,我们说某一个地方的值当小于它的时候是5%啊,5%,比如说小于这个位置往这边就是5%,那么如果我们的那个平均值是在这个这个位置这个位置。
02:01
那它是不是它的这个概率就小于5%呀,那么就说明它达到了显著性水平的这个效果,也就是说达到了5%以下,那么就可以认为这种事情发生的概率就很低了。我们就认为他。不会出现这样的情况,上节课是不是有假定检验呀,就是这样的一个情况,我先给大家去说到这,我们后续做完了题再来说一遍啊,那么就是假设第一种情况H0,假设第一种情况H0,那么H0是指说我们的人口没有30%啊,没有30%的人,呃,进入互联网。啊,没有30%,那么另那么它的反面是不是就应该是叫做H1就有30%,那么就是人数就应该是大于30%,对吧?啊那一个啊,那么我们取一个最大值来说,就是如果它恰好有30%的人接入互联网是一种什么样的情况啊,恰恰好有30%。
03:02
那么如果是恰好有30%,我们是不是假定他成绩啊,是恰好有30%,恰好有30%,它的概率的情况就是这样的,这是一个有和没有的区别,对吧?这是一个有和没有的区别,那么有和没有的区别是不是这样的,我们给它画一个分布,就是这里是没有,这里是有大概一半是吧?那么这边就是零,这边就是一,这是我们的那个这个二次项分布也还记得吧,二项分布啊,你们二项分布我们已经忘了吧,抛硬币啊,抛硬币啊,那这就是二项分布,它有两种情况,一种情况是零一种情况是一。啊,有情化是零,有型化一,那么有没有的概率是70%,有的概率是30%,啊好,这就是那个二项分布,那么我们达到了这个二项分布之后,我们来看啊,我们来看这个二项分布的一个叫做给我想一下啊,这个二项分的一个叫做平均值是多少,是不是就应该是0.3呀,因为我们说二项分布的一个计算公式,它的一个平均值的计算公式是不是就应该是NP呀,对吧?NP,那么PN就是这个东西,其实平均值就相当于是我们的期望,那么期望就应该是NPNP的话就是N有多少个乘以它的一个概率,那么我们假设说总体的数量是一,那么它是不是就应该是有0.3个呀,对吧?这是它的一个平均值。
04:31
那么我们说以这样的一个平均值的这个情况下,它的一个叫做标准差啊,它的一个标准差,标准差是这个东西,标准差应该等于多少,还记得吗?我们的这个二项分布的一个方差的一个公式等于的是。NPQ啊,NP不是NP1减P对吧,NP1减P,那么这个方差是这个,那么它是不是就应该是根号向它呀,我们说如果是标准差的话,那么这个标准差就等于的是NN,我们不算N算成一的话,那么P乘以一减P就是0.3乘以0.7开根号,这就是它的一个方差。
05:14
那么这个方差就是应该等于的是叫做根号下0.21啊,根号下0.21啊,那么这边我们已经有了,我们在这个内容里边随机的去取样,我再说一遍,我在这个内容里边随机的去取样,那么取样的这个过程就是这样子,来换一下取样的这个过程就是是不是还再往下一点啊,再往下压。那么取样的过程来竖线横线,它应该给我们的就是一个正态分布,我们每一次来上面是不是说取的是150个家庭啊,150个家庭,我们来写一下,每一次取150个家庭,那么它的曲线大体上就应该是这个样子,那么这个样子中间的平均值是多少?0.3对吧?我们上一个平均值已经写了,那么它的一个这叫什么来着?标准差应该等于多少?是不是应该是等于上面的那个标准差是根号下二零点二一除以我们的人数,人数是不是150个呀?
06:19
所以除以的是根号下150啊,150,那么这个值就是我们的这个叫做标准差啊,这个值就是我们的标准差,我们来计算一下根号下二零点二一除以150等于多少?我们的计算器呢?CTRLRCC啊,21除以1000是不是三个零呀?就是21除以15000等于。这个值这个值再开根号是吧,再开根号零点没错吧,0.374啊,0.374,我们来写一下,它也就约等于约等于0.374啊,你又忘了这个了啊,我来写一下。
07:07
就是平均值的一个方差,就等于是我们的这个原来的方差除以它的个数是不是一百五呀。那么标准差就是这个东西,标准差平均值的标准差就等于方差除以根号下一百五嘛,我们说的是标准差,那么这个标准差没没问题了吧,我们再来,那么这个是0.374。我们想要找的实际上是说它的一个显著性水平啊,显著性水平,那么显著性水平是不是就应该是叫做5%呀。那么就是0.05啊,0.05,那我们来看0.05在我们这里边的一个Z杠是多少?0.05我们找一下我们的这个叫什么Z杠的一个,它是大于30的啊,大于30应该查这个Z-Z杠杠的一个表,Z杠表来看一下,那么找一下这个这杠的表,然后我们找一下它里面的那个值是多少来着,5%,那么5%的话,我们来算一下啊,5%,那么另一侧它就是95%的了。
08:20
所以就是0.95,来找一下0.95在哪里,扩大一下吧,看不着了,0.950.90.90.940.95,那就是0.9这个这个值大家看一下是不是这个值0.95,那么0.95它所对应的是这一排,我们来看一下这一排是什么,这一排五,那么这个0.95哪去了?这1.65吧,1.6,然后上面是五一点六五,也就是说这边的这个值,这边这个值到这,比如说比如说它到这吧,那么这边想要是这个5%,那么这个值的一个Z杠,它就是1.65没问题吧,啊1.65。
09:08
那我们再来看一下我们刚刚取到的这个,刚刚取到的这个样本,它是不是有57个接入了,那么57个接入去除以我们总的样本是不是就是这个概率啊,它的概率就是57除以150,我们来看等于多少,就是我们总的这个概率啊,就是P啊X的样本的一个概率,那么就等于呃多少来着。57除以150,那么它约等于多少?我们来看一下怎么算出来的,这么牛,计算器算的吗?57除以150等于哇,0.38真厉害哎,那么就是0.38。哎,0.38距离,我就是与我们这个0.3之间的这个。
10:01
显著性水平不是区间的,这个Z杠数是多少?我们来计算一下。这值是0.040.0吗?0.0374是吗?我们来改一下,刚才没改啊,这是0.0374,那么我来这个值减去这个值除以0.0374,我们来看一下,就是我们的那个取的那个值就是X减去谬除以除以啥除以方差对吧?除以除以这个这个标准差,那么也就等于是0.38减去零点。三啊,减去0.3除以除以多少?0.0374来看0.08除以0.0374等于多少,就是0.08除以0.0374细算一下。就是0.08除以零点零三七四二点几了吧,那么也就是说我们的这个值啊,我们的这个值实际上是不是在5%的这一边呀,啊,它在5%的这一边,那么所以它就小,它的发生的概率是小于它发生的概率,P值就小于我们的这个显著性水平对吧,小于我们的显著性水平,我们就可以认为说我们的这个对吧,我们这个H0它是不符合啊,是不会发生,就是叫做。
11:29
大概率不会发生这样的情况,所以这种情况才是一个真实的样本的情况,那么也就是说我们中国的一个互联网的,就是这个接入互联网的这个率大于了30%,那么这道题就是这个样子的显著性水平,就是用来去判断说我们到底呃,要不要去呃,判定这个值为真还是为假,显著性水平。
我来说两句