专栏首页日常撸知识统计学之假设检验

统计学之假设检验

P-值规则:先把显著性水平α值转化为一定分布下的临界值,然后在计算检验统计值,最后把检验统计值与临界值相互比较来判断是否拒绝原假设。在双侧检验时,α平分在两侧,临界值为±Zα/2(正太分布的情况)或±t(α/2,n-1)(t分布)。在正太分布时,α为0.05时,Zα/2=1.96。

在单侧检验时,α处于分布某一侧,左单检验处于左侧,临界值表示为-Zα或-t(α,n-1),右单检验处于右侧,临界值表示为Zα或t(α,n-1)。在正太分布下,α为0.05时,Zα=1.64。

如果检验统计量值的绝对值小于临界值,就接受原假设;若检验统计量的绝对值大于或等于临界值,就拒绝原假设。临界值将样本统计量的概率分布区域分成了两个部分:超过临界值区域称作拒绝域,不超过临界值的区域称作接受域。

P-值规则类似。先计算检验统计值Z,然后求出统计量分布曲线图中与检验统计值相对应称之为观测到的显著性水平P值,最后把观测到的P值与显著性水平比较决定拒绝或接受原假设。

几种常见的假设检验:

一、总体均值的检验:

(1)总体服从正态分布且方差已知:

总体服从正太分布N(X,S2),那么样本均值也服从正态分布N(X,S2/n).统计量Z服从正太分布。

当原假设为真时,构造检验统计量:

(2)总体分布及方差都未知但样本容量n>30:

根据中心极限值定理,样本均值服从正太分布。由于总体分布未知,用样本方差来估计总体方差,这是统计量服从正太分布。

当原假设为真时,构造检验统计量:

(3)总体为正态分布,但方差未知且为小样本:

用样本方差估计总体方差,此时统计量t服从自由度为n-1的卡方分布。

如果原假设成立,构造检验统计量为:

二、两个总体均值之差的检验

两个总体均值分别为X1和X2,总体标准差分别为S1和S2,来自两个总体的样本容量n1和n2,样本均值x1和x2。检验的目的是两个总体的均值是否相等,或者两个总体的均值之差的是否为零。假设检验如下:

(1)两个总体服从正太分布且方差已知

根据抽样分布原理。统计量Z服从标准正太分布:

若原假设成立,构造检验统计量为:

(2)两个总体方差未知但为大样本

用样本方差来估计总体方差,当样本容量都足够大时,统计量Z服从标准正太分布:

当原假设成立时,构造检验统计量:

(3)若两个总体服从正太分布,但差未知且为小样本

此时当n1和n2都不够大时,如下统计量服从自由度为n1+n2-2的t分布:

当原假设成立时,检验统计量为:

例子:重庆市居民随机抽查100人,平均消费支出1300元,标准差为80元;成都市随机抽查了120人,平均消费为1320元,标准差为100元。问在5%的显著性水平下,重庆市和成都市的消费水平是否有显著性差异?

分析:是双侧检验的问题,原假设两城市消费水平相等23。样本均值和标准差都已知;可计算处检验统计量Z为:

在α=5%的显著性水平下Zα/2=1.96,计算得到 |Z|=-1.65<Zα/2=1.96,在接受域内,即认为两个城市的消费水平无显著性差异。

本文分享自微信公众号 - 小末快跑(Faster_Future),作者:小末快跑

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-01-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • python pandas 基础之一

    pandas的两大数据结构:Series和DataFrame. Series用于储存一个序列一样的一维数据;DataFrame用于多维数据。

    小末快跑
  • 假设检验再学习

    假设检验要解决的问题:根据样本观察得到的一些结论、根据经验积累得到的一些认识,以及由此得到的判断是否成立?假设检验是一种非常有用的统计方法,在统计学中具有重要的...

    小末快跑
  • 如何判断一个数据分布是否是正太分布?

    在数据分析过程中,得到一组数据,在分析之前,通常需要判断数据是否符合正态分布与否,再决定下一步分析方法。那么,如何判断数据是否属于正太分布呢?

    小末快跑
  • 服务器攻防·禁止穷举邮箱密码

    本文节选自《Netkiller Linux 手札》 下面是一个脚本你可以放在crontab中运行,每个一定时间运行一次。 #!/bin/bash #######...

    netkiller old
  • Unity-Optimizing Unity UI(UGUI优化)04 UI Controls

    这一章节专门针对UI Controls进行优化。大部分的UI Controls都对性能表现有一定的影响。

    祝你万事顺利
  • 51Nod-1803-森林直径

    ACM模版 描述 ? 题解 根据题目,我们知道,数据是随机建树的,所以树的深度不会特别大,约摸 lg nlg\ n,所以我们可以树归搞搞,亲测,数据随机建树深度...

    f_zyj
  • 时间序列预测全攻略(附带Python代码)

    原文作者:AARSHAY JAIN 36大数据翻译,http://www.36dsj.com/archives/43811 时间序列(简称TS)被认为是分...

    机器学习AI算法工程
  • nodejs+express应用

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

    sofu456
  • SILVER PEAK里程碑式的成功:拥有超过1000的全球客户

    Silver Peak今天宣布,目前该公司已经有超过1000的全球客户,现在正在进行的任务是将软件定义的广域网(SD-WANs)建设为一个单独的网络类别。

    SDNLAB
  • SAP ERP帐号密码安全亮红灯 黑客盯上SAP盗取用户信息

    有许多制造业者都使用SAP ERP,包括俄罗斯防毒厂商Dr. Web和一间针对SAP ERP专门资安公司ERPScan于日前发现,有一支恶意软件专门偷SAP客户...

    人称T客

扫码关注云+社区

领取腾讯云代金券