专栏首页日常撸知识假设检验再学习

假设检验再学习

假设检验要解决的问题:根据样本观察得到的一些结论、根据经验积累得到的一些认识,以及由此得到的判断是否成立?假设检验是一种非常有用的统计方法,在统计学中具有重要的地位。

所谓的假设检验就是事先对总体参数或总体分布形态做出一个规定或假设,然后利用我们得到的样本信息以一定的概率来检验假设是否成立、假设是否合理或者说判断总体的真实情况是否与原假设存在显著的系统性差异。

双侧检验是指同时注意总体参数估计值与其假设值相比的偏高或偏低倾向的检验,检验的目的是为了判断总体参数值与假设值有显著差异而不管这种差异是正差还是负差。

单侧检验指的是只注意总体参数估计值与假设值偏高或偏低的倾向的检验,是单方向的检验。检验的目的是为了判断总体参数值是否大于或小于某一假设的值。因此单侧检验又分为左单检验和右单检验。例如关心纸张厚度与0.05mm是否有差异是双侧检验;关心纸张厚度不超过0.05mm是右单侧检验。

原假设和备选假设:原假设是我们对总体参数事先提出的假设,是被检验的假设。备选假设是当原假设不成立时供选择的假设。设总体参数θ的假设值为θ0,那么原假设记为:

H0: θ=θ0。备选假设为:H1:θ≠θ0 (双侧检验);H1: θ>θ0(右单侧检验);H1:θ<θ0;(左单侧检验)。

显著性水平

假设检验的实质就是样本信息是否有充分的理由来否定原假设。做出接受原假设的含义是,只认为否定的根据还不充分,而不是认为他必然正确。因此,一方面原假设受到保护而不被轻易否定,使它处与有利地位;另一方面当原假设被接受时,又认为它不一定正确。

若原假设成立,样本统计值与总体参数假设值偏差很大是一个小概率事件。一旦小概率事件发生了,就要怀疑原假设的正确性,从而否定原假设。若一次抽样的样本统计值与总体参数假设值差别不大,那么就没有理由拒绝原假设,也就只好接受原假设。那么概率小到多少为小概率事件呢,通常取α=0.05或者0.01,有时也取0.10。而把概率小于上述值的事件称之为小概率事件。α越大,样本统计值与总体总体参数假设值之间的差异成为显著性差异的可能性就越大;α越小,样本统计值与总体参数的假设值之间的差异成为显著性差异的可能性就越小。因此称α为显著性水平

接受或拒绝原假设,评判规则有两种:临界值规则和P值规则。两种规则无差别,只是比较的值不同。

临界值规则:先把α值转化为一定分布下的临界值,然后计算检验统计值,最后把检验统计值和与临界值相比较来判断是否拒绝原假设。在双侧检验时,α平分在两侧;单侧检验时α处于分布的一侧。所谓检验统计量就是样本统计值的标准化形式,也就是所谓的标准分。计算公式为:

θ是样本统计值,θ0是总体参数的假设值,σ是总体参数的方差。凡是检验统计量的绝对值小于临界值,那么就接受原假设;若检验统计量的值大于等于临界值,那么久拒绝原假设,接受备选假设。这样,临界值就把样本统计量的概率分布区域分成了两部分,不超过临界值的区域称作接受域,把超过且包含临界值的区域称作拒绝域。

P-值规则:先计算检验统计值Z,然后求出统计分布曲线中与检验统计值相对应的,称之为观测到显著性水平P-值。最后把Z值与与事先给定的显著性水平相比较来判断接受还是拒绝原假设。在双侧检验中,若观测到的P>=α/2则接受原假设,若观测到P<α/2则拒绝原假设。单侧检验时若P>=α则接受原假设,反之则拒绝原假设。概括起来,P越小,越要拒绝原假设。

临界值规则和P值规则是等价的,取决于四个因素:本数据与原假设值之间的差距,样本容量,总体分布标准差以及给定的显著性水平

假设检验的基本步骤

1.提出原假设和备选假设;

2.确定检验的显著性水平;

3.根据样布统计量的概率分布确定出与显著性水平α相对应的临界值,即确定接受域或者拒绝域;

4.构造检验统计量,并根据样本观测数据计算出检验统计值;

5.比较检验统计值和临界值,并作出拒绝或接受原假设的判断;

常见的几种假设检验

总体均值的假设检验;

两个总体总体均值之差的假设检验;

总体成功率的假设检验;

两总体成功率之差的假设检验;

总体方差的假设检验;

两总体方差之比的假设检验。

假设检验的两类错误:

假设检验的结论是建立在样本统计信息的基础之上的,并且始终与显著性水平的高低有关。由于抽样的随机性,因此,检验统计值落入拒绝域,并不意味着原假设就不一定正确,而检验统计值落入接受域,并不意味着原假设就一定正确。所以必须要考虑两类错误。

第一类错误是“以真为假”的错误,即原假设正确但被拒绝的错误,即“弃真”错误。第一类错误的概率是由假设检验的显著性水平给出的,即α。第二类错误是“因假为真”,即原假设不正确但是被接受的错误,即“纳伪”错误。犯第二类错误的概率是当备选假设成立时,检验统计值落入了接受域的概率。第二类错误一般用β表示。

第一类错误α变小,第二类错误β就会增大;而要使β小,就必须增大α。因此在样本容量一定时,两则都达到最小是不可能的。因此有一个原则:在控制第一类错误的条件下,使第二类错误的概率尽量小。一般的,将关系重大的错误列为α,并尽量取较小的值,目的是为了保护原假设,使之不容易轻易被否定。

假设检验的功效:

由于β是拒绝真的H1的概率,因此接受真的H1的概率就是1-β,我们希望β尽可能小,也就是希望1-β尽可能大。概率1-β就称之为功效。(功效曲线)功效曲线随着实际值与假设值之间的差距变化而变化。影响功效的因素很多,例如样本容量,显著性水平………。就α和β而言,增大α,检验功效1-β就会增强。但是,α因该是主要要避免的错误,因此应该控制在一个较小的水平。所以在进行假设检验的时候需要对两类错误的概率进行适当的平衡。如果犯第一类错误的损失教严重,那么α就应该要小些,反之,可以让α大些。

求所需要的样本容量

最后,当第一类错误α和第二类错误β都已知的情况下,求所需的样本容量。

对于双侧检验,应该是:当H0为真时的上置信限等于当H1为真时的下置信限;或者当H0为真时的下置信限等于H1为真时的上置信限。

右单侧检验应该是当H0为真时的上置信限等于当H1为真时的下置信限;左单侧检验应该是当H0为真时的下置信限等于H1为真时的上置信限。在上面的等式中,根据给定的α和β查出临界值Z,再带入X0,X1和S值,就可以求出所需要的样本容量。

本文分享自微信公众号 - 小末快跑(Faster_Future),作者:望雪山

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-06-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 置信区间构建和假设检验

    例如求总体均值的置信区间的含义:选择区间上下限是为了让总体均值介于a和b之间这一结果具有特定的概率。一般选取的置信水平为0.95。

    小末快跑
  • 统计学之假设检验

    P-值规则:先把显著性水平α值转化为一定分布下的临界值,然后在计算检验统计值,最后把检验统计值与临界值相互比较来判断是否拒绝原假设。在双侧检验时,α平分在两侧,...

    小末快跑
  • MySQL 插入,更新和删除数据

    INSERT INTO customers(cust_name, cust_address, cust_city, cust_zip, cust_country...

    小末快跑
  • 《spss统计分析与行业应用案例详解》:实例十二 卡方检验

    频数分布来推断总体是否服从某种理论分布或某种假设分布,这种检验过程是通过分析实际的频数与理论的频数之间的差别或是说吻合程度来完成的。

    统计学家
  • 简明数据科学(3):你信吗?猜猜看哪!

    原文:Data Science Simplified Part 3: Hypothesis Testing 翻译:大头 校对:Kaiser 著名的匈牙利裔美籍物...

    陆勤_数据人网
  • 分享一个Django-restful-

    https://github.com/gaojiuli/DRF-startup.git

    py3study
  • Flask-2 模版使用

    首先接着上一章内容,在Flask_Blog文件夹中新建一个文件夹templates:

    亚乐记
  • WanShare:区块链供应链金融的时代来了吗

    融资难、融资成本高、融资流程繁琐一直是制约中小微企业做大做强的瓶颈之一,这里面不仅关系着金融风控问题,也有资源匹配不合理的症结存在,那么在区块链供应链金融时代,...

    链小二
  • 【编程入门】C语言堆栈入门——堆和栈的区别

    在计算机领域,堆栈是一个不容忽视的概念,我们编写的C语言程序基本上都要用到。但对于很多的初学着来说,堆栈是一个很模糊的概念。堆栈:一种数据结构、一个在程序运行时...

    程序员互动联盟
  • POJ 3984 迷宫问题(bfs+pair)

           求最短路问题,但是需要打印路径,那么就需要把路径存下来,可以用结构体来存,这里我用的是pair。最后输出路径的时候是一个递归过程,理解不了的可以手...

    Ch_Zaqdt

扫码关注云+社区

领取腾讯云代金券