术语
•HNSCC (head and neck squamous cell carcinoma)头颈部鳞状细胞癌
•Consensus Cluster 一致性聚类
• nearest-centroid classifier 最近质心分类
1
研究思路
• 数据来源:TCGA-HNSCC和GSE65858 (LHNG cohort)
• 基于1703个免疫相关基因对HNSCC进行亚型的划分
• 对分类亚型进行免疫概况(免疫细胞和免疫检查点)的展示
• 在验证集(LHNG cohort)用最近质心分类分成同样的4类后进行相同的分析
• 在测试集和验证集进行非免疫基质细胞和炎症趋化因子表达的分析
• 对4个亚型进行预后的分析(生存分析)
2
结果
2.1
划分亚型
2.2
亚型的免疫情况
24种免疫细胞的数据集来源于2013年发表的Spatiotemporal dynamics of intratumoral immune cells reveal the immune landscape in human cancer,主要思想是利用数个marker的表达来表征细胞的情况,即从基因层面上升到了基因集的层面;
2.3
在LHNG cohort进行亚型的验证
TCGA和GEO这样作为测试集和验证集的情况用得比较多;这里对GEO数据集的分类采用了最近质心分类的方法,即取训练集每个亚型的平均值为中心,待分类的样本(验证集中的样本)归属为离得最近的中心点的亚型;
2.4
非免疫基质细胞和免疫趋化因子的表达
MCP-counter源于2016年发表的文章Estimating the population abundance of tissue-infiltrating immune and stromal cell populations using gene expression,R包可方便使用,能够依据表达数据对异质组织中8种免疫细胞和两个基质细胞群体进行定量;
2.5
生存曲线的绘制
3
结语
文章依然是TCGA作测试集,GEO作验证集展开分析;这里主要是免疫相关的一些分析,利用表达数据进行免疫细胞和免疫检查点的表征,最后再落到不同亚型的预后差异(一般分型后,生存分析总是绕不开的)上;文中提到的分析,可以通过学习相应的R包或使用网页工具来做,总的来说,难度不高,可以学起来。老规矩,原文获取方式,后台回复关键词:5.3
如果您想按照这个套路针对其他癌症做相关生信分析,或您有其他生信分析需求,也可以联系小编哦