今天跟大家分享的是2020年2月发表在SCIENTIFIC REPORTS(IF:3.998)杂志上的一篇文章,在文章中作者利用GEO数据集,鉴定腰背痛的DEGs,然后通过功能注释、富集分析以及PPI网络构建,筛选到重要基因生物标志物,并通过各种生物信息学程序对其进行识别和分析。
标题:Identification of significant gene biomarkers of low back pain caused by changes in the osmotic pressure of nucleus pulposus cells
识别由髓核细胞渗透压力变化引起的腰背痛的重要基因生物标志物
一、研究背景
髓核(NP)细胞渗透压变化引起的椎间盘(IVD)变性疾病的发病率随年龄增长而增加。通常,腰背痛与IVD变性有关。然而,尚未阐明腰背痛的机制和分子靶标,也没有数据表明下腰痛的特定生物标志物。因此,该研究旨在鉴定和验证腰痛的重要基因生物标志物。在Gene Expression Omnibus(GEO)数据库中筛选了差异表达的基因(DEGs),并且还使用各种生物信息学程序对重要的基因生物标记物进行了鉴定和分析。
二、流程分析
三、结果解读
鉴定在高渗培养基中培养的NP细胞与在等渗培养基中培养的NP细胞之间的DEG。作者使用limma软件包从数据集(GSE1648)中鉴定出371个DEG,其中包括128个下调的DEG和243个上调的DEG。使用火山图显示了在高渗培养基中培养的IVD细胞与在等渗培养基中培养的IVD细胞之间的DEG。下调的DEG用绿色标记,而上调的DEG用红色标记(图1)。
图1. DEGs的火山图
分别使用DAVID、Metascape、GSEA进行分析。
(1)通过DAVID分析,基因本体分析的结果表明:
(2)使用Metascape进行的功能富集分析表明:
图2. DGEs的DAVID、Metascape分析
(3)使用GSEA进行基因本体(包括BP、CC、MF)分析表明:
表1. 根据归一化的富集得分按顺序列出了上调和下调基因组中最显著的富集
图3:上调和下调的基因集中的六个最重要的图
(4)GSEA进行的KEGG富集分析表明:
表2. 根据归一化富集得分按顺序列出了上调和下调基因组中最显著的富集
图4. 上调和下调的基因集中的六个最重要的图
图5. PPI网络和3个MCODE模块
图6. PPI网络和6个MCODE模块
(1)识别
VENN 图显示, "Metascape_MCODE", "Cytoscape_MCODE" 和 "Cytoscape_cytoHubba" 有四个重要的常见基因,包括 CCL5、OPRL1、SST 和 CXCL13(图 7A)。
(2)分析
图7. 重要基因的鉴定和分析
图8. 定量实时PCR分析
图8. NRS、渗透压力、CCL5 和 OPRL1 之间的强关联
表5. NRS和相关基因表达之间的线性回归分析
表6. 基于单变量logistic比例回归分析的相关参数对NRS的影响
表7. 基于多重逻辑比例回归分析的相关基因对NRS的影响
图8L. CCL5的ROC曲线 图8M. OPR1的ROC曲线
图9. 神经网络预测模型和NRS的高风险警告范围
小结
本篇文章的研究思路和过程较为简单,通过GEO数据库分析鉴定了371个DEG作为候选基因生物标志物,并进行了功能注释和富集分析,进一步选定了4个基因作为研究对象,分别是CCL5、OPRL1、SST 和 CXCL13。通过统计分析发现CCL5、OPRL1、SST和CXCL13这四个基因均与腰背痛相关。其中,CCL5和OPRL1的表达与腰背疼痛最相关。最后用ROC曲线、神经网络预测模型和高风险预警范围分析了CCL5、OPRL1的诊断作用。这些结果表明CCL5、OPRL1、SST和CXCL13这四个基因被确定为腰背痛的重要基因生物标志物。特别是,CCL5和OPRL1。本研究可为今后深入研究确定腰背痛的基因生物标志物提供参考。