众所周知,肿瘤外显子是TCGA计划的6大数据之一,而TCGA数据库是目前最综合最全面的癌症病人相关组学数据库,包括:
知名的肿瘤研究机构都有着自己的TCGA数据库探索工具,比如:
tcga数据库的部分病人有转录组测序信息同时也有对应的somatic突变信息,只需要结合两者理论上是可以完成任意癌症的任意基因突变与否分组后的转录组测序的差异分析。
比如,让我们看看2023的文章《STK11/LKB1-Deficient Phenotype Rather Than Mutation Diminishes Immunotherapy Efficacy and Represents STING/Type I Interferon/CD8þ T-Cell Dysfunction in NSCLC》,是如何做这个分析的。研究者们首先定义好 selected functional events (SFE) 事件:
根据上面的selected functional events (SFE) 事件在不同基因的发生情况,比如STK11基因就可以成功的把病人分组:
这个时候两个分组的样品数量是不平衡的,但是研究者们仍然是使用了limma的voom算法做转录组测序的差异分析,如下所示的差异基因火山图:
使用了limma的voom算法做转录组测序的差异分析