在假设检验中,为了保证将真的判为假的概率很低,设置犯第一类错误的概率为α\alpha,通常情况下,α\alpha等于0.05或0.01。在现行的大学教科书中,根本没有提及将假的判为真的概率计算公式,下面来介绍如何计算统计功效,并介绍它的含义。
这里http://blog.csdn.net/xxzhangx/article/details/72811527 介绍了p值的计算,我们就接着它来完善统计功效的计算。
统计功效=1−β=1−p(接受H0|H0为假)=p(拒绝H0|H0为假)
\mbox{统计功效} = 1 - \beta = 1- p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假})
这里的β=p(接受H0|H0为假)\beta = p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) 为第二类错误。
对于两样本的假设检验: 原假设: H0=H1H_{0} = H_{1} 被择假设: H0−H1=δH_{0} - H_{1} = \delta
注:这里的δ\delta不等于0
统计功效反应了在H0H_{0}为假的前提下,落入拒绝域的概率。
计算公式如下:
统计功效=p(拒绝H0|H0为假)=p(|x¯−y¯S2xnx+S2ymy−−−−−−−√|>z1−α/2|δ)
\mbox{统计功效} = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假} ) = p( | \frac{\overline{x} - \overline{y}} {\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} } } | > z_{1-\alpha/2} | \delta)
对上式子展开后为:
统计功效=1−Φ(z1−α/2−δS2xnx+S2ymy−−−−−−−√)+Φ(−z1−α/2−S2xnx+S2ymy−−−−−−−−√)
\mbox{统计功效} =1 - \Phi({z_{1-\alpha/2} - \frac{\delta}{\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} }}} ) + \Phi(-z_{1-\alpha/2} - \sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} })
代码如下:
> x <- 0.3
> y <- 0.5
> sx <- 3
> sy <- 5
> nx <- 10000
> ny <- 20000
> z <- (x-y)/(sqrt(sx^2/nx + sy^2/ny))
>
> power <- 1 - pnorm(qnorm(1-0.05/2) - z) + pnorm(-qnorm(1-0.05/2) - z)
> power
[1] 0.9906974
当然,若是改变了分布,其推导过程和上面雷同。
统计功效描述了原假设为假的条件下,我们还可以判别出原假设为假的概率。在控制犯第一类错误概率很低的条件下,如何避免犯第二类错误的概率β\beta也足够下呢?在学术界,统计功效的设定一般为0.8,将它作为计算的阈值。在p-value小于0.05且power大于0.8时认为是有显著差异的。
参考文献: [1] http://cos.name/2016/03/asa-statement-on-p-value/#more-11902 [2] http://www.jianshu.com/p/b0f4c01c7602
若是有疑问,欢迎留言讨论,谢谢!