卡方检验—拟合优度

卡方拟合优度检验

(Chi-Square goodness of fit test)

是一种非参数检验,根据样本的频数分布检验其总体分布是否等于某些给定的理论分布(如正态分布,二项分布和泊松分布等).

2325字▕ 25图▕ 预计阅读15分钟

Chi-Square goodness of fit test is a non-parametric test that is used to find out how the observed value of a given phenomena is significantly different from the expected value.

In Chi-Square goodness of fit test, the term goodness of fit is used to compare the observed sample distribution with the expected probability distribution.

Chi-Square goodness of fit test determines how well theoretical distribution (such as normal, binomial, or Poisson) fits the empirical distribution.

In Chi-Square goodness of fit test, sample data is divided into intervals. Then the numbers of points that fall into the interval are compared, with the expected numbers of points in each interval.

Statistics How To

在SPSS【分析】模块下的【非参数检验】中有两个地方可以实现卡方拟合优度检验,IBM Support是这样介绍的。

【单样本】—【定制检验】-【比较实测概率和假设概率的(卡方检验)】

【旧对话框】-【卡方检验】

这也就是为什么会在SPSS中看到三个地方有卡方检验,另一个在【交叉表】分析里面,即常用的列联表资料卡方检验。

1

数据来源

方积乾坤老师主编第七版《卫生统计学》例8-8,检验当地12岁男孩的身高是否服从正态分布?

该研究资料为计量资料,很多同学会想到t检验、F检验用到的正态性检验方法,SPSS中提供的K-S检验(Kolmogorov-Smirnov test,柯尔莫哥洛夫-斯米尔诺夫检验)和S-W检验(Shapiro-Wilk test,夏皮洛-威尔克检验),本例子基于卡方拟合优度检验思想来检验是否服从正态分布。

首先,用样本均数和标准差作为总体分布均数和标准差的估计值,经计算均数139.48,标准差7.30,检验假设为:

H0:总体分布的均数为139.48,标准差为7.30的正态分布

H1:总体分布不是均数为139.48,标准差为7.30的正态分布

α=0.05

2

卡方拟合优度检验思想

接下来我们在SPSS【非参数】检验下的【单样本】和【旧对话框】中利用卡方拟合优度检验方法检验该地12岁男孩身高是否服从正态分布?

3

SPSS实践1

数据录入,对频数进行加权处理

分析➜非参数检验➜旧对话框➜卡方检验

将分组变量选入右侧检验变量列表➜期望值有两种,一种是等比例,另一种自定义,我们根据前面计算的概率P值填入

检验结果,期望个案就是根据概率P得到,然后和实测个案书构成列联表,计算卡方统计量

由检验结果可知,卡方值为9.641,P=0.291>0.05,在α=0.05的检验水准下,不拒绝H0,差异无统计学意义,尚不能认为该地12岁男孩身高不服从均数为139.48,标准差为7.30的正态分布。

4

SPSS实践2

分析➜非参数检验➜单样本检验

字段➜将分组选入检验字段

设置➜选择检验➜定制检验➜勾选卡方检验➜选项

同旧对话框中卡方检验:将概率P值填入

统计检验结果,双击假设检验汇总,进入可视化界面

由检验结果可知,卡方值为9.623,P=0.292>0.05,在α=0.05的检验水准下,不拒绝H0,差异无统计学意义,尚不能认为该地12岁男孩身高不服从均数为139.48,标准差为7.30的正态分布。

5

扩展1

上面的假设概率是根据正态标准转换得到的每个组段的正态分布概率,在实际中,可能我们根据文献或者既往研究,已经了解每个组段的概率,我们可以在自定义期望值时输入已知概率,检验是否服从该分布。

数据录入,对频数加权处理,步骤同上

在期望值输入已知概率

统计检验结果

由检验结果可知,卡方值为20.272,P=0.009<0.05,在α=0.05的检验水准下,拒绝H0,接受H1,差异有统计学意义,可以认为该地12岁男孩身高与已知分布不同。

6

扩展2

最后我们用常用的正态性检验方法,检验该地120名男孩身高是否服从正态分布?

数据录入

分析➜描述性统计➜探索

因变量为身高➜图➜含检验的正态图➜继续➜确定

正态性检验结果

正态Q-Q图

由检验结果可知,S-W统计值为0.988,P=0.363>0.05,在α=0.05的检验水准下,不拒绝H0,差异无统计学意义,Q-Q图显示实测值沿着对角线分布,因此尚不能认为该地12岁男孩身高不服从正态分布。

参考文献:

1.方积乾.卫生统计学[M].第七版,北京:人民卫生出版社,2013.

2.http://www-01.ibm.com/support/

3.http://www.statisticshowto.com/goodness-of-fit-test/

—END—

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180825G0G37N00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券