在临床研究中,我们最常用的有logistic回归、线性回归和Cox回归。对于前两种回归分析模型,我们的教科书有比较详细的公式,根据公式很容易进行计算,用来做预测比较方便。而对于Cox回归分析,由于其是一个半参数模型,而且它的结局有两个:结局状态和时间。对于一般研究者来说,用Cox回归做预测分析十分困难,似乎无从下手。
Cox回归既然可以做危险因素分析,能计算出风险比例(HR),也是可以做个预测的。怎么做呢?
理论部分(对生存分析原理不熟悉者可略过)
Cox回归模型的生存函数表达式为
S(t∣X)是指在t时间时某种协变量(X)条件下的生存概率,要想计算它,需要知道两个参数:S(t)与Xβ。
S(t)为基础生存函数,即t时间时X=0时的生存概率。它的计算方法是:
从随时开始到t1时间的生存概率S(t1)为生存总人数除以随访总人数;
从随时开始到t2时间的生存概率S(t2)为S(t1)乘上t1时间到t2时间的生存概率,即S(t1)*S(t1→t2)。
以此累计计算……
因此S(t)是很多条件概率的乘积,不是一个公式,不能通过带入参数计算。
Xβ就比较简单了,它就是回归系数与变量的乘积的和,即
与线性回归和logistic回归相同。
实践部分
对于生存概率的计算,SPSS和SAS都给出了相应模块供我们使用。我们以SPSS为例。数据如下,有4个协变量(分期(stage)、分级(grade)、肿瘤大小(size)、某指标阳性(positive)),生存状态(status)和随访时间(time)。
点击“分析”-“生存分析”-“Cox回归”,按下图选择相应的变量,并对stage设置亚变量。
在”选项“中选中”显示基线函数“。
结果中会出现一个生存分析表:
表中第一列和第二列为相应时间对应的累积风险。
如果我们想计算一年的累积生存率,即找到12月对应的累积风险为0.001289,
12月生存函数为:
带入每个病例的Xβ即可计算出每个病例的一年生存概率。
领取专属 10元无门槛券
私享最新 技术干货