前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于机器学习的模型构建,轻松13分+!

基于机器学习的模型构建,轻松13分+!

作者头像
作图丫
发布2022-03-29 11:08:24
7900
发布2022-03-29 11:08:24
举报
文章被收录于专栏:作图丫

导语

GUIDE ╲

癌症的免疫景观越来越被认为是影响疾病进展、预后和治疗反应的关键特征。作者试图全面表征原发性口腔鳞状细胞癌(OSCC)中肿瘤浸润性免疫细胞(TIIs)的模式,并开发免疫特征衍生的模型,用于预后和治疗预测。

背景介绍

近两年越来越多的研究关注免疫landscape和预后模型构建,今天小编给大家带来一篇基于机器学习开发的预后模型结合免疫特征的高分文章。这篇文章于2021年发表在《Journal for ImmunoTherapy of Cancer》杂志上,最新影响因子13.751,题目为:Immune landscape and subtypes in primary resectable oral squamous cell carcinoma: prognostic significance and predictive of therapeutic response。

数据介绍

1、TCGA:HNSCC样本TPM数据

2、GEO:GSE41613和GSE42743 OSCC数据集(含临床信息)

GSE91061,GSE78220 接受抗pd-1或抗ctla4治疗的黑色素瘤患者 数据集

3、收集了3个患者队列共计392个样本,包含详细的人口统计学和临床病理学特征

结果解析

01

OSCC中12种TIIs亚型的位置、密度和预后意义

作者利用传统的IHC使用具有代表性的标记物标记各种TIIs,然后进行数字定量,以捕获它们在整个载灯片中的位置(肿瘤中心(CT)和侵袭性边缘(IM))和密度的特征(图2A)。图2B 显示了感兴趣的 TII 子集的代表性 IHC 染色和量化pipeline。训练队列样本中TIIs亚群的密度在样本之间和个体样本的不同区域(CT、IM)中存在差异很大(图2C)。

图2

02

使用SVM分类器开发和验证预后免疫signature

接下来,作者使用支持向量机(SVM)算法开发了一种新的OSCC-SVM免疫signature。利用这些来自训练队列的数据,OSCC-SVM signature整合了上述20个具有预后意义的候选特征中的7个免疫特征,包括CD8IM、CD45ROIM、CD11bIM、CD11bCT、CD20CT、FOXP3CT和PD-1CT作为关键的预后因素。

Kaplan-Meier曲线和单因素分析显示,这7个免疫特征与三个队列中的OS和DFS显著相关。如图3A-F所示,较高的OSCC-SVM与OS和DFS的改善显著相关(Kaplan-Meier分析,p<0.0001)。

作者希望比较OSCC-SVM与其他临床病理参数,包括肿瘤大小、颈部淋巴结转移、病理分级和临床分期对OS和DFS的预测能力。当通过5年的ROC曲线估计三个队列患者的预测OS和DFS时,训练队列中OSCC-SVM的auc为0.755,0.741,优于其他临床病理参数(<0.7,图3G、H)。在测试和验证队列中也观察到类似的结果(图3I-L)。

图3

此外,为了评估OSCC-SVM和这些相关临床病理参数对生存风险的相对重要性,作者进行了χ2比例检验,发现与其他参数相比,OSCC-SVM的风险贡献最大(图4A-C)。

为了比较OSCC-SVM与两个成熟的免疫相关评分的预测性能,作者计算了所有患者的免疫评分和T、B细胞评分。ROC曲线估计OSCC-SVM优于免疫评分和TB评分,具有最高的敏感性和特异性(图4D,E)。此外,预后预测中的一致性指数(c指数)也支持了OSCC-SVM具有更好的性能(图4F)。

综上所述,证实了OSCC-SVM是一种新的有效的基于免疫的OSCC预后生物标志物。

图4

03

从TCGA数据集评估OSCC中的TIIs

作者收集了TCGA-OSCC数据集的328个OSCC样本,其中包括转录谱数据和临床特征。如图5A所示,OSCC中TIIs浸润存在显著的异质性。

利用LASSO回归模型从上述 24 个TIIs中提取 14 个特征,并通过计算风险评分构建预后预测模型(图5B),根据风险评分的中位数将患者分为低风险或高风险亚组。Kaplan-Meier分析显示,该预后模型可以对具有不同预后的患者进行分层,高危组患者比低危组OS显著降低(图5C)。为了评估该预后模型的预测能力,作者应用了不同随访时间的ROC分析,发现模型对OS预测的敏感性和特异性很好(图5D)。在两个独立的OSCC队列(GSE41613和GSE42743,图5E、F)中也得到了类似的发现。

图5

04

基于TIIs的风险评分在预测治疗反应中的临床价值

为了进一步扩展TIIs-based风险评分的临床意义,作者利用TCGA的OSCC数据集,发现未放疗患者比放疗患者显著降低OS(p=0.0035,图5G),低风险亚组患者的放疗没有获得生存获益(图5H)。

鉴于目前没有关于OSCC接受免疫治疗的数据集,作者使用黑色素瘤和尿路上皮癌队列的数据集(IMvigor210,GSE91061和GSE78220)来探索TIIs-based风险评分预测ICB免疫治疗的能力。通过ssGSEA计算了这些队列中每个患者的TIIs-derived风险评分,发现这些评分能够将患者分为高、低OS亚组(图5I、K和M)。与对免疫治疗没有反应的患者相比,对免疫治疗有反应的患者的这些评分显著增加(图5J、L和N)。重要的是,TIIs-based风险评分的性能优于选定的癌症免疫治疗预测生物标志物,如PD-L1、PD-1表达和细胞溶解活性,这表明构建的模型具有强大的预测潜力和稳定性。

05

基于OSCC中免疫landscape的患者一致性聚类

基于ssGSEA在TCGA数据集的OSCC样本中估计的24个TIIs,通过一致性聚类识别出k=2具有最优的聚类稳定性(图6A,B)。共328例OSCC患者被分为两个亚组,即cluster 1(n=151)和cluster 2(n=177)。如图6B、C所示,大多数TIIs如B细胞、CD8T细胞、细胞毒性细胞、TReg、NK在cluster 1中显著富集。重要的是,与第2组患者相比,第1组患者的OS有所改善(图6D)。

图6

小编总结

作者通过传统病理方法和生物信息学分析对OSCC的免疫landscape进行了描述,通过机器学习开发了从TIIs中获得的稳定预后模型,将患者分为不同生存的亚组,以及从放疗后和免疫治疗中获益。

这篇文章使用了一些机器学习方法进行模型构建,在多个数据集中进行验证,均得到了不错的结果,大家可以多多学习相关的思路哦!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档