无序成组设计的行×列表资料的卡方检验之SPSS,SAS,STATA实现

1

应用范围和应用条件

应用范围:对多个率或多个频率分布做出比较

应用条件:

(1)行×列表资料中任一格子的频数不应小于1,且1≤理论频数T<5的格子数不宜超过格子总数的1/5

(2)行×列表资料中的两个分类变量均为无序变量

2

极简标题

举例

例:研究血型与胃溃疡、胃癌关系,得到如下表(图1)资料。

问:血型与疾病有无关联?

图1

SPSS方法操作

第一步建立数据库(两种形式)

形式一:原始数据库,一个观测(个体)一行,没有频数汇总(该形式不需要加权处理数据)(图2)

图2

形式二:对相同情况的研究对象进行了汇总(分析前需要加权处理)(图3)

图3

第二步数据加权

(仅第二种数据形式需要此步骤,告诉SPSS频数表示的是人数):Data-Weight Cases- Weight Cases by 频数-ok(图4、5)

图4

图5

第三步:数据分析

(1)Analze-Descriptive Statistics-Crosstabs-将ABO血型和疾病状态两个变量分别放入Row(s)和Column(s)(图6、7)

图6

图7

(2)点击右侧的Statistics,选择Chi-square进行卡方检验-continue(图8)

图8

(3)点击右侧的Cells,选择你需要在结果列联表中显示的内容,包括观测值、期望值、百分比等等-continue-ok(图9)

图9

第四步:结果显示与分析

(1)交叉表(表1)中为cells选项中你所选择的内容

表1

(2)卡方检验结果(表2):渐进Sig.(双侧)为P值=0.020,最小期望计数T为6.37,没有单元格的期望计数小于5,P

表2

SAS方法

第一步:建立数据库

程序语句:

运行上述程序语句后,即可得下图数据库(图10)

图10

第二步:数据分析

第三步:结果显示与分析

图11

看第三行一般关联的概率值为P值,P=0.0198,同SPSS

Stata方法

第一步:数据分析

·若有原始数据:

图12

tab2后为行变量和列变量名;

chi2表示卡方检验;

column表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例;

row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;

若需要进行Fisher精确检验,可加exact。

·若仅有频数:

图13

tabi后依次为第一行第一列、第一行第二列、第一行第三列频数;

\表示换行,之后为第二行第一列、第二行第二列、第二行第三列频数……;

chi2 row column功能同上。

第二步:结果显示与分析

表3

格子中三个数分别为频数、行百分比、列百分比;

表格下方的Pr表示P值,为0.020,解释同SPSS

(1)没有原始数据,仅有频数时,必须先加权(weight cases)

(2)对于多个频率或频率分布比较的卡方检验,P,仅表示多组之间有差别,但并不是任两组之间都有差别,若要明确哪两组间不同,还需进一步作多组间两两比较

(3) 使用卡方检验在任何情况下都要注意理论频数T不能太小,一般要求各格的理论频数均应>1,且1≤T

(4) 若超过1/5格子数1≤T

· 增加样本量

·专业允许情况下,将理论频数过小的行或列与性质相近的邻行或邻列合并

·删除理论频数过小的行/列

·采用确切概率法

作者:蔡璨

编辑:ll

校对:大话统计工作组

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181006G1NRJK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券