生信论文的套路
第43篇生信论文的分享。先不说论文思路,但是论文题目过于简单,其实可以点出与肿瘤免疫浸润表型相关。
根据最新影响因子的数据,Aging-US的影响因子已经跌破5分,自引率约为10.4%,稳升中有降低。但实在话,国人占比似乎越来越高,说明期刊对国人还算友好。在投稿的时候,可以作为选择。
摘要写作部分,言简意赅,清晰明了。数据库的介绍,基本都是简单句(标黄)。结果是简单句和复合句的结合,最起码阅读起来,轻松明确。个人推荐认真学习和借鉴该论文摘要部分的写作。
首先是转录水平的差异分析,作者使用肝癌专用肿瘤数据库HCCDB做差异分析,然后结合oncomine数据库做验证。HCCDB数据库是肝癌领域研究人员的福利哦,我们前面简单提到过。
相对oncomine数据库,HCCDB数据库的数据稍显单薄,在引用数据的时候,必须要验证。因此,果友们可以了解,但是个人并不推荐。有兴趣可以登陆数据库网址:http://lifeome.net/database/hccdb。
UALCAN分析基因差异表达与性别,年龄和种族以及肿瘤分期的关系,属于临床意义的探究。个人认为,数据呈现时,必须主线是明确的,比如乳腺癌是以女性为主,肺癌以男性为主,在探究某基因在肿瘤中的差异表达时,可以分析性别与其相关性。但是肝癌的话,个人并不推荐做性别、年龄的相关性分析。至于种族倒是可以作,因为中国属于肝癌中高区,具有“中国特色”,与国外酒精性“肝癌”不同,我们以病毒性“肝癌”为主,虽然有向酒精性“肝癌”转变的趋势。差异表达与肿瘤分期的相关性在临床上极为重要,因此而是可做的。
用km plotter数据库做生存分析,并用GSE数据做验证。这种数据展示方法值得借鉴(还在摸索中)。
接下来,作者用LinkedOmics数据库做共表达分析,使得数据丰满起来;同时用这些共表达基因做进一步分GO分析和KEGG富集分析。因为cBioPortal以前可以分析共表达的top50基因,但是现在不能使用了。我们可以借助LinkedOmics来完成。
网址:http://linkedomics.org/login.php
表格进一步呈现富集分析的结果。
cBioPortal数据库做基因组学的探究,属于机制一。
接下来,通过共发生文件(co-occurence profiles)的分析,探究参与其致病的基因和信号通路,该部分分析使用Networkanalyst数据库。共表达基因是指与PRPF3表达相关的基因,而共发生文件是指与PRPF3表达差异变化一致的基因,这是两种概念。根据分析,作者发现,PRPF3差异表达与肿瘤免疫浸润密切相关。
共发生分析网址:https://www.networkanalyst.ca/
然后,作者用TIMER分析PRPF3与肿瘤浸润的关系。图D使用的是GEPIA数据库,我们之前有展示;并以三线表的形式展示PRPF3与活化T细胞表面分子的相关性。
总体而言,这篇论文虽然题目稍显简单,但是从摘要到数据,再到论文思路,逐步递进,环环相扣,是难得的好论文。值得借鉴。
论文题目
Prognostic potential of PRPF3 in hepatocellular carcinoma.