统计 | 统计功效 | R语言

努力在北京混出人样

发布于 2019-02-18 18:11:41

2.2K0

发布于 2019-02-18 18:11:41

在假设检验中，为了保证将真的判为假的概率很低，设置犯第一类错误的概率为α\alpha，通常情况下，α\alpha等于0.05或0.01。在现行的大学教科书中，根本没有提及将假的判为真的概率计算公式，下面来介绍如何计算统计功效，并介绍它的含义。

这里http://blog.csdn.net/xxzhangx/article/details/72811527 介绍了p值的计算，我们就接着它来完善统计功效的计算。

统计功效=1−β=1−p(接受H0|H0为假)=p(拒绝H0|H0为假)

\mbox{统计功效} = 1 - \beta = 1- p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假})

这里的β=p(接受H0|H0为假)\beta = p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) 为第二类错误。

对于两样本的假设检验：原假设： H0=H1H_{0} = H_{1} 被择假设： H0−H1=δH_{0} - H_{1} = \delta

注：这里的δ\delta不等于0

统计功效反应了在H0H_{0}为假的前提下，落入拒绝域的概率。

计算公式如下：

统计功效=p(拒绝H0|H0为假)=p(|x¯−y¯S2xnx+S2ymy−−−−−−−√|>z1−α/2|δ)

\mbox{统计功效} = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假} ) = p( | \frac{\overline{x} - \overline{y}} {\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} } } | > z_{1-\alpha/2} | \delta)

对上式子展开后为：

统计功效=1−Φ(z1−α/2−δS2xnx+S2ymy−−−−−−−√)+Φ(−z1−α/2−S2xnx+S2ymy−−−−−−−−√)

\mbox{统计功效} =1 - \Phi({z_{1-\alpha/2} - \frac{\delta}{\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} }}} ) + \Phi(-z_{1-\alpha/2} - \sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} })

代码如下：

> x <- 0.3
> y <- 0.5
> sx <- 3
> sy <- 5
> nx <- 10000
> ny <- 20000
> z <- (x-y)/(sqrt(sx^2/nx + sy^2/ny))
> 
> power <- 1 - pnorm(qnorm(1-0.05/2) - z) + pnorm(-qnorm(1-0.05/2) - z)
> power
[1] 0.9906974

当然，若是改变了分布，其推导过程和上面雷同。

统计功效描述了原假设为假的条件下，我们还可以判别出原假设为假的概率。在控制犯第一类错误概率很低的条件下，如何避免犯第二类错误的概率β\beta也足够下呢？在学术界，统计功效的设定一般为0.8，将它作为计算的阈值。在p-value小于0.05且power大于0.8时认为是有显著差异的。

参考文献： [1] http://cos.name/2016/03/asa-statement-on-p-value/#more-11902 [2] http://www.jianshu.com/p/b0f4c01c7602

若是有疑问，欢迎留言讨论，谢谢！

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2017年06月12日，如有侵权请联系 cloudcommunity@tencent.com 删除

http

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

http

登录后参与评论

0 条评论

热度

统计 | 统计功效 | R语言

统计 | 统计功效 | R语言

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐