假设检验的方法论

用户7506105

发布于 2021-08-09 07:33:19

6650

在概率论与数理统计课程中有块特别重要的部分是假设检验，众所周知，假设检验是判断是否接受原假设或备择假设的一种手段，它是用来判断样本与样本、样本与总体的差异是由样本抽样的误差引起还是由样本本质差别造成的统计推断方法，在各种概率算法中占有举足轻重的地位，比如统计建模任务就一定要通过一些检验才能算完成。

假设检验是利用统计方法和抽样样本信息对原假设和备择假设做出取舍判断的一个过程，分为参数假设检验和非参数假设检验

一些概念

原假设

一般是需要证明保护，不容易轻易否定的假设，记作

H_0

备择假设

一般是原假设不成立时必定选择的假设，记为

H_1

参数假设检验

即总体分布已知，检验某个未知参数的假设，比如某一批样品(样本根据先验经验知道总体分布)的质量平均数是否达到标准(未知参数为平均数)

非参数检验

总体分布未知的假设检验问题，比如等待红绿灯时间是否服从泊松分布等

预备知识

样本均值

\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i

样本方差

S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2

方差分母为n-1表明的是自由度，即当n-1个样本确定了，第n个样本因为平均数也确定了

样本方差服从的分布

\frac{(n-1)*S^2}{\sigma^2} \sim \chi^2(n-1)

两类典型错误

原假设实际上是正确的，但却被判定为拒绝，即弃真

P(拒绝H_0|H_0为真) = \alpha

原假设实际上是该被拒绝的，却被判定为接受，即存伪

P(接受H_0|H_0为假) = \beta

应该是这两类错误尽可能小，但这两类错误是鱼与熊掌的关系，一般只能通过增加样本容量

思想

实际上基于的是小概率原理，比如抽样一些学生成绩取平均数

\bar{X}

，是否能用此平均数代替全校学生的平均数M，所以原假设是这一批的平均数是全校学生的平均数，备择假设则不然，所以如果

|\bar{X} - M| < \epsilon

则说明原假设成立，否则拒绝原假设，关键问题是确定ε的大小，所以这个值一定是小概率发生的值(根据显著性水平相关)，小概率事件是一次实验中几乎不可能会发生的

显著性水平，即衡量小概率事件是否显著发生的量度，一般有0.05，0.01，0.1等标准，即为第一类错误的条件概率α

做法

提出一个合理的原假设
假定在原假设成立的情况下构造一个统计量
根据统计量的分布及选定的显著性水平确定小概率事件的发生标准(即拒绝域)

分类

单个正态分布总体的假设检验

两个正态总体的假设检验

总体分布函数的假设检验

总结

一般的假设检验就是这些场景，核心思想主要是根据已有的样本数据计算出统计量的值，然后根据统计量的值是否落入到某一特定显著性水平下的边界值所在的区域内来决定是否拒绝原假设，难点在于构建特定分布的统计量，但是分布也就那么几种嘛，慢慢套，不一定需要会推公式但是可以观察公式特点哈哈哈

附参考资料

概率论与数理统计(浙大版)

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2021-06-30，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自碎片学习录微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度