X-tile软件在生存数据中选择截断值的应用

在临床研究中,多数情况下,连续指标与结局的关联不是线性关系,比如血压与心血管疾病发生的关系,可能在血压在升高到一定值后心血管事件发生突然升高,另外连续指标在临床应用时不如分类指标方便,因此临床应用相关指标时总会想办法找到一个正常范围或截断值。对于于一般的二分类结局指标,可以用ROC曲线去实现,但对于生存类型的数据,寻找截断值比较困难。今天给大家介绍一款小软件,快速实现寻找截断值。

软件的名字是X-tile,是耶鲁大学开发的单一功能小软件(话说国外统计专家多会编程,又特别爱编小软件、小程序)。软件只有2M,问度娘就可以下载到了。安装过程也很简单,不需要特殊设置,这里就不细说了。软件打开后是这样的界面:

简洁明了,左上角是官网,中间的声明中提示不要用于商业用途。可以操作的只有左下角“Analyze”和右下角”Exit”。点击“Analyze”后:

此时只能点击左上角“file”-“open”,弹出对话框,可以导入你的数据,这个软件现在可以比较好的支持txt数据,因此我们将数据复制到txt文件里,如下图:

数据包含三个变量,年龄,生存状态和时间(月),目的找到一个或几个好的年龄节点,其生存率明显不同。将数据导入后,可以看到有三个变量,点击任何一个变量,在中间可显示变量的具体取值。右侧是操作界面。

将生存状态、生存时间和目标变量选入相应的框(此软件可以对1-2变量取截断值,选取到Marker1,Marker2即可),本研究只研究一个连续变量,Marker2空着就可以。点击左上角的”Do“-“Kaplan-Meier”-“Marker1”,出现

此时鼠标放在中间直方图的不同位置,上面表中可以给出以鼠标所在位置为截断点分成两组,进行log-rank检验的结果。

在左侧中间的图上(下图)左健单击:

此时上方表格给出最优截断值。

可以看到软件认为最优分为组,35-44组病死率89%,45-58岁组病死率为80%,59-81岁组病死率为100%,右侧三组比较的卡方值在7.1-4.5之间。三组的生存曲线是明显分开的。

对于生存数据寻找截断值,上述软件可快速找到最优截断值,对于不会编程的小伙伴们非常实用。

而其背后的原理也非常简单,就是“枚举法”,即以不同的值作为截断值分组进行统计检验,检验结果p值最小的结果可以认为是最好的截断值,也即是向数据学习的结果。

你会用了吗?

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180724B19YB700?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券