生信论文的套路
第39篇生信论文的分享。
单纯生信数据库的数据分析,没有湿实验验证,发表在4分+的期刊上。
摘要写作,背景中按照疾病背景,引出基因,提出科学问题的逻辑进行,内容稍多。方法中列出,太简单了,也不值得学习,所有的数据库都是果友们熟悉的技能。结果是总结式写作,没有具体的数值,但是很清晰,值得借鉴;结论还是蛮清楚的。
差异表达部分,作者采用oncomine+三线表的方式。前面说过,对于单基因的差异分析,尤其是与肿瘤浸润免疫细胞表型相关的分析,芒果建议采用oncomine+TIMER双验证的方法,有局部聚焦(oncomine)和全局通览(TIMER)的神奇效果,但是只是一种选择。
然后作者通过UALCAN数据库对转录水平的差异表达进行确认。双确认是目前生信论文的主流,就像湿实验,一般要重复两次,增加实验的说服力,这也是科研的严谨性。
用GEPIA分析基因表达与肿瘤分期的相关性,属于临床意义的探究。
用GEPIA数据库做无疾病生存率和全生存率的分析,作者没有选择km plotter数据库验证。个人认为,最好双确认,或者提供解释说明。
然后作者用cBioPortal数据库做组学、基因相关性和蛋白互作,属于机制的探究。这种探究跟免疫浸润机制不同,是从基因组学,蛋白水平做不同层次的摸索,是生化分子角度;而免疫浸润的机制探究,是从免疫学和肿瘤学角度出发,立足点不同。因此,基因组学、蛋白互作和免疫浸润是可以出现在同一篇生信论文中的,是并列关系。
富集分析探究机制。根据GO分析,CXCL基因家族与细胞表面信号通路,蛋白的胞外域和信号转导活性相关。根据KEGG分析,CXCL基因家族与趋化因子信号通路,细胞因子受体相互作用和肿瘤信号通路有关。
探究参与调控的关键转录因子(TRRUST数据库),是对基因家族上游分子的分析,值得借鉴。新技能!
探究转录因子调控的靶细胞(LinkedOmics数据库),是对下游信号分子的分析,与上游分子的分析结合起来,前后呼应,值得学习。新技能!
免疫浸润机制的探究。探究CXCL家族分子与肾癌肿瘤浸润免疫细胞之间的相关性,这是TIMER数据库的基本功能。意义很大,但难度不大。
最后cox回归分析,增加说服力。阐述六种免疫细胞与肾癌的相关性,以及CXCL基因家族分子与肾癌的相关性。三线表的形式,一目了然。
总体分析,这篇论文的生信技能都是我们在公众号里面分享过的,其中以TIMER数据库的使用为主,难度并不大。在做差异表达的分析时,作者采用oncomine+UALCAN数据库双验证的方式。我们已经分享过oncomine+GEPIA双确认,oncomine+TIMER双确认两种方式。关键是双确认总比单个数据库有说服力。
具体用哪两种组合,每个人都有自己的偏好,能说明问题就行。但是,个人经验来说,免疫浸润表型分析,首选oncomine+TIMER;相关性分析较多,尤其是涉及基因表达的相关性,基因表达与肿瘤分期的相关性,首选oncomine+GEPIA;若涉及基因组学,如甲基化等,则首选oncomine+UALCAN。
题目