分类资料的统计分析

讲座内容预告

3

第二讲:分类资料的统计分析

主讲人:夏雪 PhD candidate

分类变量的分析方法小结:

(1)率的组间比较及两两比较;

(2)构成比的比较;

(3)等级资料的组间比较;

(4)配对资料的比较;

(5)多层资料的比较。

分类资料根据设计不同可以分为独立的组间比较或配对设计的组间比较,根据组别不同可以分为两组比较和多组比较,根据分析结果的性质可以分别有序和无序指标的比较。不同的设计、组别、数据类型需要有不同的分析思路。这里将分类资料组间比较的分析方法简要总结如下:

1)2*2表(四格表)资料的分析思路

2*2表资料指行变量为二分类的分组指标,列变量为二分类的分析指标。

例数大于40,且所有理论频数大于5,选用卡方检验。

例数大于40,所有理论频数大于1,且有理论频数小于等于5,选用校正的卡方检验或者是Fisher精确概率检验法。

例数小于40,或者是有理论频数小于1,可以采用Fisher精确概率检验法。

(2)2*C表资料的统计分析思路

2*C表是指行变量为二分类的分组指标,列变量为多分类的分析指标。

如果分析指标为无序分类变量,可用卡方检验分析组间构成比是否有差异,如果例数小于40或者是有理论频数小于1,可以采用Fisher精确概率检验法。

如果分析指标为有序分类变量,用卡方检验只能说明组间构成比是否有统计学差异,无法说明等级的差别。如要比较组间等级差异是否有统计学意义,可用Wilcoxon秩和检验或者是Ridit分析。

(3)R*2表资料的统计分析思路

R*2表资料是指行变量为多分类的分组指标,列变量为二分类的分析指标。

组间的差异比较可采用卡方检验。如果组间差异有统计学意义,可用Bonferrioni法进一步做两两比较。以分析具体哪几组之间的差别是有统计学意义。

(4)R*C表资料的统计分析思路

R*C表资料是指行变量为多分类的分组指标,列变量为多分类的分析指标。

行变量为无序的或有序的分组指标,列变量为无序的分析指标,可用卡方检验分析组间构成比是否有差异。如果组间差异有统计学意义,可用Bonferrioni法进一步做两两比较。

行变量为无序的或有序的分组指标,列变量为有序的分析指标,可用卡方检验分析组间构成比是否有差异。如果要比较组间的等级差异,可用Kruskal-Wallis秩和检验或者Ridit分析。如果总的有差别,还可以再进一步做两两比较。

(5)配对分类资料的统计分析思路

两种方法之间的差异性比较,可用McNemar检验做配对的卡方检验。

(6)多层分类资料的统计分析思路

以某一变量分层进行组间差异性比较,可用Mantel-Haenszel 卡方检验;如果Breslow-Day检验无统计学意义,表明层间一致,可计算合并的卡方值。

温馨提示

由于每次讲座都有资料发放,请参加讲座的同学扫码入群,以便统计听众人数准备足够的资料。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181114G0NOTQ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券