松哥带您分享一篇文章带来的若干思考

缘起

昨天收到一个既往学员的统计咨询,松哥发现这是一个非常好的问题,于是便整理此期,希望与大家一起分享学习。11

问题截图如下图表1:

问题1:本例应该用什么统计分析方法?

问题2:该作者下面的每个卡方是如何算出的,是否正确?

问题3:该问题可以有哪些思考?

原文文章《大剂量伐昔洛韦联合针刺治疗带状疱疹的临床观察》,中国药房2016 年第27 卷第26 期。

案例说明:

本例一看数据即是属于成组设计的2组,试验效应指标为等级资料。按照原作者文中的表述,观察组总有效率97.9%,对照组90.7%,进行了两组总的疗效比较。同时又对痊愈、有效、好转和无效进行了单独的比较。

松析1:

具备一定统计基础的人,看到这样的数据,认为疗效为等级资料,作者采用的卡方检验,肯定错了。

其实未必,因为作者比较的总有效率之间的差异,根据其研究的目的,数据就已经变为二分类,有效和无效了,数据格式变为如下图:

SPSS数据录入格式如下:

SPSS卡方检验(成组四格表资料卡方检验)结果如下:得到结果卡方=4.645,P=0.031,与原作者卡方=4.722,P=0.030,基本相同,如果有错,作者错了,松哥没错,呵呵!

松析2:

原作者,又对每个子项进行卡方检验,得到相应的卡方和P值,是怎么算出来的呢?松哥估计,他是再次分割,以痊愈为例,重新切割为下图:分为痊愈与未痊愈的二分类,然后继续进行四格表资料卡方。是不是的呢?

松哥再次进行卡方验证,得到下图结果:卡方=10.545,P=0.001,与原作者分析结果一模一样,看来原作者就是这么分析的。

但是这样子做对不对呢,松哥认为这种做法似乎不妥,因为研究变量的类型一般就为3类,根据3类进行方法选择,作者将疗效痊愈、显效、好转、无效分为4个变量,然后进行分析,等于一个问题分成4个,进行4次检验,肯定会增大I类错误的发生概率。故这种做法松哥表示不太认同。有点乱用统计分析方法之嫌。

松析3:

如果是比较2组的疗效有无差异,松哥认为采用非参数检验的效果应该更好。有人会认为,分成有效和无效,进行卡方,,就像本例一样,不是也挺好的吗?

其实,等级资料包含的数据信息要高于二分类资料,当我们降等级降为二分类进行分析,就已经损失了很多的信息。

本例如果采用非参数检验,下图为原作者的数据表。

采用非参数检验的方法,发现Z=-3.285,P=0.001。结合秩均值,得出观察组的疗效优于对照组。这和卡方检验的结果一致。

可是松哥认为,非参数检验得到的结果包含的信息更多。不信请看下表,下表数据如果按照作者的做法分为有效和无效,那么观察组和对照组的有效率还是97.9%和90.8%。卡方检验的结果还是一致,认为观察组比对照组有效。可是观察组真的比对照组好嘛?

当松哥采用非参数检验分析时,发现观察组秩均值=109.54,对照组=85.46,并且P=0.001。竟然认为对照组比观察组疗效要好哦。

松析4:

也有人会说,是否可以用有序Logistic回归进行分析,不也可以吗?松哥认为,选什么方法,应该考虑研究目的,本例研究目的是比较两组的疗效是否有差异。那就应该采用差异性检验分析方法中的t、F、卡方、非参数。Logistic的确可以分析出观察组相对于对照组的OR值,但并不是反映其差异的分析方法,也不能够回答研究值目的。

松析5:

就这个案例,如果仅仅比较两种方法有效率的差异,可以考虑合并后的卡方检验;但要想知道两种方法的疗效差异,则应该采用非参数秩和检验。如果研究观察组干预措施相对于对照组的风险比值,可以采用Logistic回归。

松哥统计说

有人说:统计就是为了折磨人而生的,对于缺乏统计思维的人而言,也许是吧。学习统计必须先学统计思维,否则真的容易走火入魔,而自废武功。

突然想到一个问题,对于本例,您认为是有效率有差异比较有意义,还是两组疗效有差异有意义呢?欢迎留言讨论。

OK,本期到此,感觉对您有用,还请分享转发,我是松哥,一个有点唠叨的统计老师!

精鼎数据分析联盟,期待您的加盟!在数据处理方面,欢迎您来投稿!

SPSS系列文章列表【2】

【若有用,请分享!】

----------------------------------------------

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180927G01I0700?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券