cBioPortal数据库是探索肿瘤的基因组学特征,是从DNA水平进行的,是对机制的进一步研究。基因差异表达、生存分析和免疫浸润分析,上述分析严格意义上讲均属于表型。免疫浸润分析属于交叉,算是表型式的解释,就是用现象解释现象,但其实并没有涉及具体的机制。
cBioPortal网站目前存储DNA拷贝数数据(每个基因的假定,离散值,例如“深度缺失”或“扩增”,以及log2水平),mRNA和microRNA表达数据,非同义突变,蛋白质水平和磷蛋白水平(RPPA)数据,DNA甲基化数据和有限的临床数据等,可以快速获取大规模癌症基因组学项目的分子谱和临床预后相关性,并将这些丰富的数据集转化为可视化数据以用于临床。
首先登陆cBioPortal官方网站http://www.cbioportal.org/。
以乳腺癌为例,分析E2F基因家族基因突变在乳腺癌发生中的作用。选择权威的数据库,比如TCGA数据库的数据,勾选好。再点击Query by gene
出现下图,输入基因名称,点击submit query。
出现分析结果图。
也可以查看肿瘤类型总结。
还可以进行生存分析,但是分析出的结果往往没有差异,所以不推荐使用。
这里涉及一个概念——肿瘤突变负荷(tumor mutational burden,TMB)。TMB是指正常等位基因(A)突变成等位基因(a),在选择上不利的纯合体(aa)所引起群体适应度下降的现象。
在肿瘤研究中,TMB被定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。
量化的描述TMB,可分为4类,与肿瘤免疫治疗关系密切。
1. TMB-High=>20mutations/Mb;
2. TMB-Intermediate, 6-19 Muts/Mb;
3. TMB-Low <= 5 Muts/Mb;
4. TMB-Unknown, if the sample is not of sufficient quality to confidently determine Tumor Mutation Burden.
上述图还可以进一步通过PPT编辑,转换成文章中用图。
以上几个功能是cbioportal的重要功能,当然还有很多小功能,如查询基因在肿瘤中突变类型的总结分析、点图展示、突变基因的enrichment分析和基因突变数据下载等等,分析结果可直接应用于发表paper,但是需要引用(网站有介绍)。