上次我们分享了 指定病人的指定基因的突变全景瀑布图,好像一下子戳中了大家的痛点,很多粉丝留言表示感谢,这下子他们终于可以在自己的风险预后模型区分了病人高低分组后,可视化铁死亡基因集,细胞焦亡基因集的突变情况,对比展示。
但是接下来大家又想问,同样的想比较两个分组的免疫评分的差异,但是免疫评分的工具太多了,比如有一个2019的综述文章:《Comprehensive evaluation of transcriptome-based cell-type quantification methods for immuno-oncology》比较了常见的免疫细胞比例推断工具的表现,另外一个2018的综述《Quantifying tumor-infiltrating immune cells from transcriptomics data》提到工具更多,起码十几款了。大家也不可能一一研读,下载,测试,使用它。但是又确实看到了大量数据挖掘文章都使用了这些免疫评分信息啊,比如:新鲜出炉(2021年6月)的文章:《Identification of a Ferroptosis- Related LncRNA Signature as a Novel Prognosis Model for Lung Adenocarcinoma》 ,就对比了 ESTIMATE, TIMER, MCP counter, CIBERSORTx,和ssGSEA ,如下所示:
ESTIMATE, TIMER, MCP counter, CIBERSORTx,和ssGSEA
类似于的分析在很多数据挖掘文章里面都有,再比如同样是2021年的文章:《Characterization of a ferroptosis and iron-metabolism related lncRNA signature in lung adenocarcinoma》,最后一个大图也是:
Fig. 5 Immune infiltration analysis. A Heatmap for immune responses based on TIMER, CIBERSORT, QUANTISEQ, MCP-counter, XCELL, and EPIC algorithms among high and low risk groups.
TIMER, CIBERSORT, QUANTISEQ, MCP-counter, XCELL, and EPIC
虽然我们确实写了教程,每个软件如何使用,如何解读其结果,比如 estimate看基质和免疫细胞比例 ,来源于2013数据挖掘文章,作者就整理了两个基因集来根据表达量矩阵使用estimate方法去量化肿瘤样品里面的基质细胞和免疫细胞的比例。教程目录是:
但是一口气学十几款软件也确实难为大家了,其实绝大部分数据挖掘文章都是临床医生做的,他们并不具备软件安装调试以及跑通的能力,唯一的解释就是这些免疫评分,都不是自己算的,是公共数据库里面就有的:
比如在 https://gdc.cancer.gov/about-data/publications/pancanatlas 我们可以找到:https://gdc.cancer.gov/about-data/publications/panimmune
肿瘤免疫评分大全
这里面应有尽有,需要的仅仅是提取里面的数据,进行可视化即可!其它软件的免疫打分,也可以去各自的官方网站下载现成的!
当然了,使用R语言最佳,再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下:
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习: