今天分享一篇发表于Cancer Immunol Immun,影响因子为4.9的文献。标题是Immune cell infiltration as a biomarker for the diagnosis and prognosis of stage I–III colon cancer. 文章利用CIBERSORT进行免疫细胞比例的计算,据此进行诊断模型和预后模型的构建和评估,并进行了基因富集分析用于生物学功能的阐明;
术语
●CMS(consensus molecular subtype)共识分子分型,将结直肠癌(CRC)患者分为4个亚型(CMS1-微卫星不稳定型、CMS2-经典型、CMS3-代谢型、CMS4-间质型),旨在基因表达水平区分患者的内在异质性。
研究思路
• CIBERSORT对样本进行免疫细胞比例计算,并依据计算结果进行样本筛选,得到940个样本用于后续分析
• 构建诊断模型,ROC曲线进行模型评价
• 构建预后模型,依据pIRS分为高低两组后,进行生存曲线绘制
• 单因素和多因素cox分析确认模型是否可作为独立预后因子
• 整合预后模型和临床病理因素进行列线图构建,校正曲线、DCA曲线、C-index分析对列线表与TNM分级的表现进行比较
• 临床意义(不同临床分组下,pIRS的差异;pIRS与肿瘤相关基因的相关性);
• 富集分析了解low-、high-pIRS的通路和其他基因集富集情况
结果
2.1构建诊断预测模型
利用CIBERSORT对表达矩阵进行计算,得到样本对应的免疫细胞比例,此时每个样本有22个免疫细胞比例marker的指标;通过随机森林和lasso-Logistic,得到交集的8个marker,用于诊断模型(即dIRS)的构建;用小提琴图展示在肿瘤和正常组织中dIRS得分有显著差异;模型在测试集和验证集的ROC曲线下面积分别为0.98和0.96,认为模型能够很好地区分结直肠病人和正常样本;
2.2 构建预后模型
利用单因素cox分析和lasso-Cox(点击查看),构建预后模型,并在测试集和验证集,依据pIRS得分将样本分为low-pIRS和high-pIRS两组,进行生存曲线的绘制,发现在多个数据集中表现均为,low-pIRS较high-pIRS预后好,且具有统计学意义。进行单因素cox和多因素cox回归分析,认为pIRS模型可以作为独立预后因子;
2.3 构建列线图
整合pIRS模型和训练集的临床病理因素构建列线图;利用列线图(点击查看)预测的复发率和真实复发率进行校正曲线的绘制,认为列线图能够较准确地对复发进行预测;DCA曲线认为,相较TNM分级,在2-,3-,5-year复发率的预测,均为列线图净获益更高;C-index分析也认为列线图优于TNM分级;
2.4 临床意义和生物学功能
在多个临床分组下进行pIRS的计算,pIRS在除淋巴结转移等级外的临床分组具有显著差异;此外,还进行了pIRS与免疫检查点、EMT、细胞毒性因子相关基因的相关性研究;对low-pIRS和high-pIRS进行GSEA富集分析,研究通路富集情况,low-pIRS在细胞周期调控、DNA修复、细胞凋亡和免疫激活相关通路富集,high-pIRS则在代谢相关基因集富集;
结语
CIBERSORT去卷积计算免疫细胞比例,lasso、随机森林、cox用于模型构建,DCA、ROC、C-index分析用于模型评价;对pIRS高低分组进行富集分析,便落到了生物学意义上;这个思路很清晰,可以借鉴用于模型构建与评价。