名词解释
•IC50 (half maximal inhibitory concentration)最大半抑制浓度,可以用来衡量药物诱导凋亡的能力,即诱导能力越强,该数值越低;
•TIL(tumor infiltrating lymphocytes)肿瘤浸润淋巴细胞,当存在大量的肿瘤浸润淋巴细胞时,表明机体启动了对抗肿瘤的免疫反应
•SNF(Similar network fusion)相似网络融合,一种新的数据整合计算方法;首先为每种数据类型构造一个样本相似性网络,然后使用一种新的网络融合方法来对这些网络进行融合。
•cosine similarity 余弦相似性
PART
1
研究思路
– 病人:Xena TCGA-LUAD 的5种数据类型(gene expression RNAseq, DNA methylation, miRNA expression, SCNAs,somatic mutation)
– 细胞系:基因表达和DNA甲基化数据(GDSC),肺癌细胞系的体细胞突变数据(COSMIC),药物敏感数据(CTRP、CCLE)
• 将病人分为两个亚型:PS1和PS2;将细胞系分为两个亚型:CS1和CS2;
• 从KRAS突变病人的多个数据类型中提取出一些有意义的生物学特征:Smoking-相关甲基化分子特征、TIL-相关得分、KRAS 依赖评分、Smoking-相关突变分子特征、STK11 和 KEAP1突变状态、其他分子特征;
• KRAS-mutant 细胞的敏感性药物筛选;
• 基于以上生物学特征,建立单因素和多因素回归模型,进行药物反应预测;
PART
2
结果
2.1划分亚型
这是后续分析的基础,整合多个组学数据后,利用SNF-CC将病人和细胞系数据划分为两个亚型;
2.2 KRAS突变相关的生物学特征
smoking-相关的甲基化分子特征
对分出的两个亚型的甲基化数据,从分子和整体水平用火山图和箱线图展示甲基化水平的变化,PS2较PS1甲基化水平高,CS2较CS1甲基化水平高;箱线图还涉及到了未突变的KRAS 的甲基化水平;
TIL相关得分
对表达数据用GSEA进行富集分析,发现:PS1和CS1的富集通路相似,PS2和CS2的富集通路相似,且与免疫相关;
对3个组别HE染色切片的TIL比例进行比较,用箱线图展示,PS2的TIL比例高于PS1且差异显著;
利用217 TIL相关基因对分出的亚型进行计算,并用箱线图展示,在病人和细胞系中,均为亚型2高于亚型1且差异显著;
KRAS 依赖得分
KRAS与Ras通路相关,为了进行评价,文章进行了KRAS依赖得分的计算;KRAS依赖得分包括Singh Score 和Loboda Score,来源于两个研究;同样,用箱线图进行整体展示;
吸烟相关突变分子图谱、STK11和KEAP1突变、其他特征
分别从病人和细胞系中提取出突变相关分子图谱,并与COSMIC的30个突变分子图谱进行比较,PSig1和CSig1与COSMIC的Sig4高度相关,因此确立了吸烟相关的分子图谱的重要性;相应在病人和细胞系亚型中进行分子图谱的比较,发现吸烟相关分子图谱在亚型1显著高于亚型2;
在病人和细胞系中展示KRAS热点突变(G12、G13、Q61等)和STK11、TP53和KEAP1突变类型的展示(STK11和KEAP1的突变在PS1显著高于PS2;在细胞系亚型中KEAP1具有相似表现);
在病人中进行相关临床特征的比较,PS1的年龄较PS2小,且具有统计学意义;
2.3 药物敏感性
基于CCLE 和 CTRPv2数据库,确立了细胞系亚型相关的药物,13种CS1特异药物,1种CS2特异药物;比较了细胞系亚型对药物的敏感性后,用箱线图进行展示;
2.4 药物预测
精准医学以来,结合多组学数据,提前对病人药物敏感性进行确认,建立这样的预测模型就变得越来越重要;
除药物敏感性数据外,以上生物学特征均在两个亚型进行了比较;这里用其来进行回归模型的构建,以单因素和多因素回归模型的方式对药物反应进行预测;单因素回归模型结果用表格展示了β的显著性;多因素结果用森林图展示β和对应显著性;