卡方检验—初步了解

Karl Pearsonn

被称之为百科全书式的学者.

Born27 March 1857 Islington, London, England

Died27 April 1936 (aged 79) Coldharbour, Surrey, England

Known for

Pearson's chi-squared test

Pearson's r

卡方检验(Chi square test)由现代统计学之父Karl Pearson在1990年提出("On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling" . Philosophical Magazine. Series 5.50: 157–175. doi:10.1080/14786440009463897.),下面为原始文献,另外Pearson积矩相关也由其提出。

Pearson chi square test(1990)

基 本 原 理

比较实际观测频数与理论频数之间的偏离程度(差异),实际频数与理论频数之间的偏离程度决定卡方值的大小,卡方值越大,表示二者差异越大,由抽样误差导致的差异概率P值就越小。

下面以独立样本四格表资料为例

卡方分布是一种连续型随机变量的概率分布,卡方分布的形状依赖于自由度v值的大小,随着自由度v增大,曲线趋向于对称分布,当自由度v趋向于无穷大时,卡方分布愈逼近正态分布,上图为自由度v分别等于1、2、3、4和5时的卡方分布的概率密度曲线。自由度v为1时,其概率密度曲线在0到正无穷区间呈L型分布。

卡方分布界值表

由上面两张图可知,当自由度v等于1,卡方值为3.84时,所对应概率的P值等于0.05;以自由度v等于1为例,卡方值越大,所对应的右侧面积越小,概率P值就越小。

主 要 用 途

比较两个或多个独立样本频率或独立样本频率分布

比较配对设计样本频率分布或定性观察一致性评价

两个分类变量之间的关联系分析

两个分类变量之间的线性趋势检验

拟合优度检验,检验某个连续变量的分布是否与某种理论分布相一致(如是否符合正态分布、是否服从均匀分布等)

资 料 类 型

独立2×2列联表资料

配对2×2列联表资料

2×C列联表表资料

R×2列联表表资料

双向无序R×C列联表资料(分组、指标变量无序)

单向有序R×C列联表资料(分组变量无序,指标变量有序)

单向有序R×C列联表资料(分组变量有序,指标变量无序)

双向有序,属性相同的R×C列联表资料,等价于配对R×R列联表资料

双向有序,属性不同的R×C列联表资料(分组变量有序,指标变量无序)

分层列联表资料

方 法 选 择

独立2×2列联表资料(四格表资料)

n≥40且T≥5时,使用专用公式,即查看Pearson卡方值

n≥40若有1≤T<5时,使用校正公式,查看连续性修正值

n<40或者T<1时,使用Fisher确切概率法

配对2×2列联表资料(McNemar检验值)

b+c≥40,使用专用公式

b+c<40,考虑校正公式

独立R×C列联表资料

1/5格子理论频数小于5或者有小于1的理论频数,Fisher确切概率法

配对R×R列联表资料(查看McNemar-Bowker检验值)

内部一致性检验(查看Kappa检验值)

趋势性检验(查看Linear by linear association检验值)

独立2×C、R×C列联表资料等级效应检验(查看Mann–WhitneyU或Kruskal-Wallis H检验值)

相关性检验(查看Correlations检验值)

注 意 事 项

校正公式仅用于四格表资料,对于多组分布,一般不做校正。

样本量<40或者理论频数T<1时,应考虑使用Fisher确切概率法。

R×C列联表资料的卡方检验,只能推断构成比是否有差异,对于等级资料要选用非参数秩和检验,以推断等级强度,于此同时采用何种统计检验方法,还应考虑研究目的。

多个样本频率或者频率分布比较的卡方检验,若拒绝零假设,只能说明多组之间有差异,具体哪两组,需做多重比较。

卡方检验时格子理论频数不宜太小,一般认为R×C表中不宜有1/5以上格子的理论频数小于5或有小于1的理论频数,否则有可能产生偏性。(当理论数不满足要求可采取以下方法处理:1.增加样本含量,这是最好的办法;2.删去理论频数太小的行与列;3.结合专业知识将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并,是否可以合并要根据样本的专业特性来确定,合并可能会损失样本信息,损害样本的随机性,合并处理可能会影响推断结论)。

比较样本频率分布是否相同,需关注研究对象的同质性。

参考文献:

1.方积乾.卫生统计学[M].第七版,北京:人民卫生出版社,2013.

2.https://en.wikipedia.org/wiki/Karl_Pearson,维基百科.

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180721G1N0HJ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券