前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于SEER数据库的临床预测模型轻松发3分SCI

基于SEER数据库的临床预测模型轻松发3分SCI

作者头像
百味科研芝士
发布2020-02-24 16:48:49
4.3K0
发布2020-02-24 16:48:49
举报
文章被收录于专栏:百味科研芝士百味科研芝士
今天继续和大家分享一篇临床预测模型文章,同样是基于SEER数据库的一篇预测模型,于2019年11月发表在Annals of Translational Medicine(IF=3.689)上。

总体而言,文章套路清晰,易学习模仿。

Title: Development and validation of prognostic nomogram for young patients with gastriccancer

标题:建立并验证青年胃癌患者预后的预测模型

文章总体概览:

作者通过检索SEER数据库2004年-2015年的胃癌患者数据,纳入549例资料详细的年龄<45岁的患者。将549例患者分为训练集(n=276)和验证集(n=273)。随后,在训练集中进行单因素COX回归及多因素COX回归,最终确定与预后(本文同时研究了OS和CSS)独立相关的危险因素。基于独立危险因素建立了Nomogram并进行验证和评价。文章总体流程见图1。

图1.文章整体流程

文章结果概述如下:

01

患者基本信息

作者对纳入研究队列的患者(n=549)基本信息进行了概述。其中包括性别、种族、组织学分级、TNM分期、常见位置及SEER分期。同时,作者利用X-tile软件确定了Age和Size的最佳截断值,并将患者分为根据截断值将患者分为3组。(注:X-tile的具体介绍和使用方法见文末)

02

建立预测模型

首先,作者利用单因素COX回归分析确定了与OS相关的的因素。随后,将单因素中P<0.2的因素纳入多因素回归分析并确定了与OS独立相关的因素,包括肿瘤尺寸及肿瘤位置。同时,利用同样的方法,作者确定了与CSS独立相关的因素,包括肿瘤尺寸、肿瘤位置及SEER stage。基于独立危险因素,作者建立了预测青年胃癌患者术后3年及5年OS和CSS的Nomogram。(见图2、图3)

图2. OS Nomogram

图3. CSS Nomogram

03

验证Nomogram

在内部验证验证中,OS Nomogram的C指数为0.688 (95% 置信区间:0.629–0.747),而在CSS Nomogram的为0.785(95% 置信区间: 0.735–0.835)。在独立队列的外部验证中,OS和CSS Nomogram的C指数分别为0.633 (95% 置信区间: 0.579–0.687)和0.733 (95% 置信区间: 0.686–0.780)。作者同时建立了3年及5年的ROC曲线并描述了其对应的AUC值,均表现出来较好的区分度(AUC: 0.725-0.793),见图4。此外,作者建立了3年及5年的校准曲线,结果表明列线图预测的生存率(包括OS及CSS)与实际生存率具有较高的一致性,见图5(此推送仅展示OS结果,CSS类似)。最后,通过DCA结果,研究发现Nomogram展现出了与TNM及SEER stage相当的临床适用能力。并且在OS Nomogram优于TNM而CSSNomogram 优于SEER stage,见图6。

图4. ROC曲线

图5. 校准曲线(OS)

图6. DCA结果

笔者总结:本文通过SEER数据库建立了青年胃癌患者OS和CSS的预后预测模型,并进行了验证。通过统计学分析+R语言技术建立了临床适用性较强的Nomogram。通读文献,初学者可能对其中部分内容存在疑惑,相信最多人想问的就是为什么这里的单因素P<0.2的纳入了多因素分析,不是一般都是0.05吗???作者这么做也是有道理的,而且这样的做法也是有众多文献可以支撑的。2008年,肿瘤权威期刊《Journal of clinical medicine》发表了一篇文章对Nomogram进行了详细介绍,文中指出纳入Nomogram的变量应该取决于临床资料的可获取性和临床证据,而不是统计学意义(参考文献2)。此外,样本量的限制也可能使得部分变量在单因素COX回归中呈现出P>0.05而其可能在多因素COX回归中P<0.05,。因此,在本文中,纳入统计分析的患者数量为276。为了最大限度减少样本量限制而导致的统计偏移,研究团队选择P<0.2为单因素分析的截断值具有重要的意义。从结果中,我们也可以发现这一操作带来的好处。在OS的生存分析中,我们发现肿瘤位置在单因素COX分析的P为0.062,而在多因素中却表现出P<0.05。

此外,对于X-tile这个软件可能很多人也很陌生。笔者初次接触此软件后爱不释手,其对于生存分析的相关资料处理具有极大的作用。X-tile是是耶鲁大学开发的单一功能小软件,其详细介绍于2004年被发表于肿瘤学国际期刊《Clinical cancer research》,见参考文献3。通俗易懂的讲,其可以将一个连续变量进行2分类或者3分类甚至多分类截断,选择出最佳的截断值,这个截断值可以将研究对象分成若干组,若干组之间的生存趋势具有最大的差异。举个例子,本文中的年龄与患者预后的关系,很多小伙伴会说直接把年龄当成连续性变量进行分析,这样也没错。但是,年龄与结局的关联不是线性关系,另外相对于连续性变量,分类变量的临床可操作性显然更强。因此,此时X-tile就可以大显身手了,其可以寻找一个最佳的年龄截断值,将患者分为3组,3组之间的生存模式差异实现最大化,

本文来源:临床预测模型Nomogram

参考文献:

1. Yu Chaoran,Zhang Yujie,Development andvalidation of prognostic nomogram for young patients with gastric cancer.[J].Ann Transl Med, 2019, 7: 641.

2. Iasonos Alexia,Schrag Deborah,Raj Ganesh V et al. How to build and interpret a nomogram for cancer prognosis.[J] .J. Clin. Oncol., 2008, 26: 1364-70.

3. Camp Robert L,Dolled-FilhartMarisa,Rimm David L,X-tile: a new bio-informatics tool for biomarker assessmentand outcome-based cut-point optimization.[J] .Clin. Cancer Res., 2004, 10:7252-9.

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-02-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档