生信论文的套路
cBioPortal网站目前存储DNA拷贝数数据(每个基因的假定,离散值,例如“深度缺失”或“扩增”,以及log2水平),mRNA和microRNA表达数据,非同义突变,蛋白质水平和磷蛋白水平(RPPA)数据,DNA甲基化数据和有限的临床数据等,可以快速获取大规模癌症基因组学项目的分子谱和临床预后相关性,并将这些丰富的数据集转化为可视化数据以用于临床。
首先登陆cBioPortal官方网站http://www.cbioportal.org/。
以乳腺癌为例,分析E2F基因家族基因突变在乳腺癌发生中的作用。选择权威的数据库,比如TCGA数据库的数据,勾选好。再点击Query by gene
出现下图,输入基因名称,点击submit query。
出现分析结果图。
也可以查看肿瘤类型总结。
也可以进行生存分析,但是分析出的结果往往没有差异,所以不推荐使用。
这里,设计肿瘤研究的一个基本问题——肿瘤突变负荷(tumor mutational burden,TMB)。TMB是指正常等位基因(A)突变成等位基因(a),在选择上不利的纯合体(aa)所引起群体适应度下降的现象。
在肿瘤研究中,TMB被定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。
量化的描述TMB,可分为4类,与肿瘤免疫治疗关系密切。
1. TMB-High=>20mutations/Mb;
2. TMB-Intermediate, 6-19 Muts/Mb;
3. TMB-Low <= 5 Muts/Mb;
4. TMB-Unknown, if the sample is not of sufficient quality to confidently determine Tumor Mutation Burden.
上述图还可以进一步通过PPT编辑,转换成文章中用图。
以上几个功能是cbioportal的重要功能,当然还有很多小功能,如查询基因在肿瘤中突变类型的总结分析、点图展示、突变基因的enrichment分析和基因突变数据下载等等,分析结果可直接应用于发表paper,但是需要引用(网站有介绍)。