生信论文的套路
第44篇生信论文的分享。题目,显得单薄。文章3分+。
摘要方法部分,详细介绍数据库,有些是尚未在公众号分享的。
作者直接从生存分析的角度入手,利用km plotter数据库分析NDRG基因家族基因在胃癌中表达差异与存活率的关系,并分析其与HER2表达、肿瘤分期的相关性。
作者最精彩的分析在Figure4,通过高表达组和低表达组的对比,确认NDRG1-4基因差异表达与存活率的关系,而且结果跟km plotter的数据相符,图做得也很漂亮。数据库是 TRGAted platform。
网址:https://nborcherding.shinyapps.io/TRGAted/.
然后,在临床意义探究的基础上,作者对差异表达进行分析。转录水平的差异用GEPIA数据库(包括差异表达, 与肿瘤分期的相关性和基因表达的相关性);蛋白水平的差异用HPA数据库,结果展示差异很明显。
然后作者进一步分析HER2和EGFR表达与NDRG基因表达的相关性,是从机制上探究差异表达的意义,确认EGFR与NDRG的作用相关。
再从富集分析和蛋白互作的角度分析NDRG参与调控肿瘤的机制。
接着,作者从基因组学的角度——DNA甲基化情况,探究NDRG参与调控肿瘤的机制。尽管UALCAN也可以做甲基化分析,但是只有肿瘤和正常组织甲基化差异的对比,没有对甲基化具体情况的展示。这里作者使用的是另外一个甲基化数据库——MethSurv。
网址:https://biit.cs.ut.ee/methsurv/.
最后,在基因组学分析,通路富集分析,蛋白互作和甲基化分析之后,作者通过TIMER数据库,探究基因差异表达与肿瘤免疫浸润的关系,
最终,作者以示意图的形式,阐明NDRG基因家族基因参与胃癌的分子机制。但是,整体而言,文章的数据很多,但是没有很好的逻辑在里面。这是很可惜的地方。因此,生信分析逻辑永远重于数据分析。数据库的掌握,并不是多多益善,够用就好。
题目
Characterization of the prognostic values of the NDRG family in gastric cancer.