生存分析指的是一系列用来探究所感兴趣的事件的发生的时间的统计方法。
生存分析被用于各种领域,例如:
癌症研究为患者生存时间分析,
“事件历史分析”的社会学
在工程的“故障时间分析”。
在癌症研究中,典型的研究问题如下:
某些临床特征对患者的生存有何影响?
个人三年存活的概率是多少?
各组患者的生存率有差异吗?
相关视频
基本概念
在这里,我们从定义生存分析的基本术语开始,包括:
生存时间和事件
生存函数和风险函数
癌症研究中的生存时间和事件类型
有不同类型的事件,包括:
复发
死亡
观察开始到观察终止的_时间_通常称为_生存时间_(或事件发生的时间)。
癌症研究中两个最重要的评价方法包括:i)_死亡时间_;和ii)无_复发存活时间_,其对应于治疗反应与疾病复发之间的时间。它也被称为无_病生存时间_和无_事件生存时间_。
如上所述,生存分析侧重于直到发生感兴趣事件(复发或死亡)的期望持续时间。
Kaplan-Meier生存评估
Kaplan-Meier(KM)方法是一种非参数方法,用于估计观察到的生存时间的生存概率(Kaplan和Meier,1958)。
生存曲线是管理生存概率与时间的关系曲线,它提供了一个有用的数据总结,可以用来估计诸如中位生存时间之类的衡量指标。
R生存分析
生存分析总结和可视化生存分析结果
示例数据集
我们将使用生存包中提供的肺癌数据。
inst:机构代码
时间:以天为单位的生存时间
状态:状态1 =审查,2 =死亡
年龄:年龄
性别:男= 1女= 2
ph.ecog:ECOG表现评分(0 =正常 5 =死亡)
ph.karno:Karnofsky表现评分(差 = 0 正常= 100)由医师评定
pat.karno:Karnofsky表现评分由患者评估
膳食:餐时消耗的卡路里
wt.loss:过去六个月的体重下降
计算生存曲线:survfit()
我们要按性别来计算生存概率。
函数_survfit_()可以被用来计算Kaplan-Meier生存估计。
使用函数_Surv_()创建的生存对象
要计算生存曲线,请输入以下内容:
默认情况下,函数print()显示生存曲线的摘要。它显示观察数,事件数量,中位数生存和中位数的置信区间。
如果要显示生存曲线的更完整摘要,请输入以下内容:
可视化生存曲线
我们 生成两组受试者的生存曲线。
_legend.labs_更改图例标签。
领取专属 10元无门槛券
私享最新 技术干货