术前术后血清cfDNA中KRAS突变是胰腺癌预后的生物标志物(回顾性研究)
往期回顾
在上期中,我们提到了卡方和Fisher’s精确检验(确切概率法),以及如何比较Kaplan–Meier曲线差异,本文将使用SPSS软件进行详细操作。
6
卡方和Fisher’s精确检验的正确使用
上一篇中,我们讲到了卡方检验的使用是有条件的:
1)对于R×C表资料检验
不宜有1/5以上格子的理论频数
由卡方检验的条件,可以看出何时使用Fisher’s精确检验,但实际上,Fisher’s精确检验的能力要比这边说的更强大,Fisher’s精确检验的基本思想是:在四格表的周边合计不变的情况下,用公式直接计算表内四个组合的概率。
严格来说,他不应该是卡方检验的备胎,理论上所有2×2和R×C表,均可使用确切概率法,结果可信,也不受样本量和理论频数的限制,只是由于以往的计算机能力的限制,导致自由度比较大或者样本量比较大的时候,耗时太长,所以才多用于小样本的四格表检验
2)对于2×2的列联表:
(1)当最小理论频数Tmin≥5, n≥40时,直接用Pearson卡方检验;
(2)当1≤Tmin
(3)当Tmin
1、R×C表
①数据整理
②选择Analyze > Descriptive Statistics > Crosstabs..
③交叉表中各个参数的设置
④结果解读
从第一张结果中,可以看出,理论频数都≥5,总例数>40,可以用卡方检验;第二张结果中,有理论频数都<5,且超过1/5的各数,应该选择精确检验。
2、2×2表
①-③操作同前
④结果解读
2×2表中,会比R×C表多一项连续修正结果,其对应的是理论频数≥1且<5,N≥40时使用的。
另外需要强调的是,本质上,以上情况都可以使用Fisher's精确检验的结果!
7
比较Kaplan–Meier曲线差异
生存曲线常见的比较方法有Log-Rank(最为常用)和Wilcoxon法(又称为Breslow法);Log-Rank检验在实际工作中应用较多。
①数据整理(本例是将某基因表达水平按三分位数分为三组)
②选择Analyze→Survival→Kaplan-Meier
③生存分析中各项参数设置
④结果解读
表1. 各组的例数
表2. 生存时间平均值和中位数
生存分析的平均值和中位数表格给出了生存时间估计的结果,显示三组平均生存时间的估计值、标准误和估计值的95%可信区间,以及中位生存时间的估计值、标准误和估计值的95%可信区间。
图1 生存曲线
表3 两两比较结果
参考文献:
1. Nakano Y, Kitago M, Matsuda S et al. KRAS mutations in cell-free DNA from preoperative and postoperative sera as a pancreatic cancer marker: a retrospective study. Br J Cancer. 2018 Mar 6;118(5):662-669
医统家园格言
我们不生产数据,
我们只是数据的挖掘机!
如有统计问题,欢迎咨询!
不要错过
领取专属 10元无门槛券
私享最新 技术干货