前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >统计| p值的计算

统计| p值的计算

作者头像
努力在北京混出人样
发布2019-02-18 16:35:08
3.1K0
发布2019-02-18 16:35:08
举报

p值的计算,R语言和python的实现

今天来说说频率中假设检验要依赖的评估指标:p值,对,你也许很清楚的知道它表达的意思,但是它是怎么算得的呢?不知道你是否知道呢?这次将介绍几种分布计算p值的方法(套路)。

这里以两样本均值的假设检验为例来说明。要介绍的分布有:

  • 正态分布
  • t分布

设两样本分别为XX和YY,基于中心极限定理,无论XX和YY属于什么分布,只要样本量足够大,它们的均值服从正态分布。由于两者是独立样本,故而它们均值之也服从正态分布。

1、大样本情况下 设样本XX为x1、x2、⋯、xnx_{1}、x_{2}、\dots、x_{n},样本YY为y1、y2、⋯、ymy_{1}、y_{2}、\dots、y_{m},它们的均值分布为:x¯、y¯\overline{x}、\overline{y},方差为S2xn、S2ym\frac{S_{x}^{2}}{n}、\frac{S_{y}^{2}}{m}。

那么对应的统计量为:

Z=x¯−y¯S2xn+S2ym−−−−−−−√∼N(0,1)

Z = \frac{ \overline{x} - \overline{y}}{\sqrt{ \frac{S_{x}^{2}}{n} + \frac{S_{y}^{2}}{m}}} \sim N(0,1)

假设检验的介绍看博客:http://blog.csdn.net/xxzhangx/article/details/67640775

p值是说在原假设成立的条件下,原假设发生的概率,若是p值小于0.05,发生概率小于0.05时,认为是小概率发生了,即是差异性显著,拒绝原假设。

公式: 双边假设的p值:

p=P(z<−|x¯−y¯S2xn+S2ym−−−−−−−√|)

p = P( z < -| \frac{ \overline{x} - \overline{y}}{\sqrt{ \frac{S_{x}^{2}}{n} + \frac{S_{y}^{2}}{m}}} | )

代码

> x <- 0.3
> y <- 0.5 
> sx <- 3
> sy <- 5
> nx <- 10000
> ny <- 20000
> z <- (x-y)/(sqrt(sx^2/nx + sy^2/ny))
> p = 2*pnorm(-abs(z))
> p

结果: [1] 1.608277e-05

2、小样本情况下:

  • 方差相等
  • 方差不等

方差相等时,

方差不等时:

> m1 <- c(10)
> m2 <- c(13)
> sd1 <- c(3)
> sd2 <- c(5.3)
> num1 <- c(300)
> num2 <- c(230)
> se <- sqrt(sd1*sd1/num1+sd2*sd2/num2)
> t <- (m1-m2)/se
> 2*pt(-abs(t),df=pmin(num1,num2)-1)

结果: [1] 4.280554e-13

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年05月30日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档