导语
多发性硬化症(MS)是一种由自身免疫介导的中枢神经系统(CNS)脱髓鞘疾病。MS的诊断和预后尚无客观的临床指标。细胞外蛋白糖基化程度最高,可能会进入体液作为潜在的生物标志物。
背景介绍
肿瘤相关分析目前已经被大家研究的很全面了,不如将视角转向非肿瘤相关分析。今天小编为大家带来的这篇文章,作者致力于研究多发性硬化症中细胞外蛋白的功能与挖掘相关生物标志物。文章发表在《Frontiers in Immunology》上,影响因子为:8.786,文章题目为:Identification and Clinical Validation of Key Extracellular Proteins as the Potential Biomarkers in RelapsingRemitting Multiple Sclerosis。
数据介绍
本研究所用MS表达数据来自GEO数据库。通过蛋白质注释数据库筛选细胞外蛋白质差异表达基因(EP-DEG)。
技术路线
本研究技术路线如图1所示。
图 1
结果解析
01
DEGs的识别
为了比较MS组和对照组之间基因表达的差异,本研究进行了样本之间的差异基因表达分析。GSE5839数据集中四个样本基因的中位数、上下四分位数、最大值和最小值基本相同(图2A)。通过相关性分析,本研究发现MS 组的组内相关性更强(图 2B)。主成分分析显示MS组与对照组中心相距较远,说明MS组与对照组基因表达存在差异(图2C)。通过差异基因表达分析本研究共筛选出540个DEGs。 P值最小的前三个上调基因是CTSC、JUND和NINJ1,下调基因是ZNF506、CYP7A1和LOC101926913(图2D)。DEGs 热图显示,DEGs 在 MS 组中持续上调或下调,这与对照组有显著差异(图 2E)。
图 2
02
EP-DEGs的筛选
为了找出在MS组和对照组中差异表达的编码细胞外蛋白的基因,本研究参考现有公共图书馆中注释的细胞外蛋白基因,从DEG中筛选出EP-DEGs并对其进行分析。将HPA数据库中标注的编码细胞外蛋白的基因与DEGs进行交叉,共筛选出69个EP-DEGs。将Uniprot数据库中标注的编码细胞外蛋白的基因与DEGs进行交叉,共筛选出132个EP-DEGs。这两种方法得到的EP-DEGs是统一的,只有一个基因没有重叠。因此,本研究共筛选了 133 个 EP-DEGs,包含87 个上调和 46 个下调(图 3A )。
图 3
MS组和对照组中P值最小的前10个上调基因为CTSC、NINJ1、MAPKAPK2、SPAG11A、CSF3R、CTRB2、MERTK、PLEKHO2、NAGA和KRT13。前 10 个下调基因是 HDGFL3、KITLG、ANGPT4、ADCY1、OS M、SLC4A4、PSG5、ENPEP、MMP1 和 FGF20(图 3B)。P值最小的前30个EP-DEGs上调和下调的热图显示,SLC4A4、IL17A、ADH6、OSM和ADCY1在MS中显著下调,聚类距离接近(图3C)。
03
EP-DEGs的GO和KEGG通路富集分析
为了研究 EP-DEGs 的功能,本研究对 EP-DEGs 进行了 GO 和 KEGG 富集分析。结果发现 EP-DEGs主要富集于细胞粘附的正向调节、BPs的细胞-细胞粘附调节、CCs的含胶原细胞外基质以及MFs的信号受体激活剂活性和受体-配体活性(图4)。
图 4
其中,MDK、LGALS1、CD74、PYCARD、BMP7、IL2、IGF1、IL13、KITLG、ANGPT4、OSM、IL3、EDIL3、TNFSF8在BPs、CCs和MFs至少两个方面富集(图5)。
图 5
接下来本研究参考人类基因组,分别富集KEGG通路中的上调和下调基因,结果发现上调基因富集于金黄色葡萄球菌感染、补体和凝血级联反应、细胞因子-细胞因子受体相互作用和自身免疫性甲状腺疾病,而下调基因富集于 PI3K-Akt 信号通路、癌症通路、rap1 信号通路和 ras 信号通路(图 6A、B)。
图 6
04
PPI网络的建立和Hub基因的鉴定
为了研究EP-DEGs对应的蛋白质之间的相互作用,本研究使用STRING数据库构建了133个EP-DEGs的PPI网络(图 7A)。 接着本研究构建了功能模块,只有一个模块的评分>5,由 9 个基因和 34 个边组成(图 7B)。本研究使用 Cytoscape中CytoHubba插件的10种拓扑方法筛选top10 hub基因。有 4 个基因在十种方法中均出现,即 IL17A、IL2、CD44、IGF1(图 7C)。其中, IL17A 是存在于功能模块中的基因,是 MCC 方法(最准确的方法)中得分最高的下调基因 。本研究CytoHubba 用于构建第一个与 IL17A 相互作用的节点基因,结果共筛选出16个基因(图7D),包含10个上调,6个下调。
图 7
05
IL17A、Del-1和ResolvinD1水平及其与临床数据的相关性
为了验证鉴定出的关键细胞外蛋白,本研究纳入排除 CNS 感染性疾病和近期感染的 51 名 RRMS 患者和 20 名原发性头痛患者用于检测IL17A、Del-1的水平。本研究还检测了RRMS患者脑脊液中resolvinD1的水平。RRMS 患者的 Del-1 和 resolvinD1 水平升高,RRMS 患者的 IL17A 水平降低(图 8A-C)。三种细胞外分子与临床指标的相关性分析显示,RRMS患者脑脊液中resolvinD1水平与Del-1呈正相关,而resolvinD1水平与蛋白质和IgA呈负相关(图8D-F)。
图 8
06
Del-1诊断疗效和生存分析
为了研究Del-1对RRMS诊断和预后的预测作用,本研究进行了ROC曲线和生存分析。结果发现Del-1对RRMS的诊断准确率较高,IgG对RRMS的诊断有一定的准确率(图9A),在RRMS的诊断模型中,Del-1的诊断效果优于IgG,结果具有统计学意义。Del-1的临界值为1623.882pg/ml,该临界值对应的敏感性%为82.4%,特异性%为100%。Del-1按中位数分为高组和低组,对RRMS患者进行了生存分析(图9B、C)。结果显示,高Del-1组中位无复发生存时间为30个月,低Del-1组中位无复发生存时间为13.5个月,差异有统计学意义。
图 9
小编总结
本研究:1)分析了MS人脑组织的基因表达谱,筛选出了133个EP-DEGs。2)预测了它们参与的生物过程和通路。3)预测了4个关键的细胞外蛋白和16个可能与IL17A相互作用的细胞外蛋白。4)验证了临床样本中IL17A、Del-1和resolvinD1的水平,并对Del-1进行了生存分析,发现Del-1可能与RRMS的复发和进展有关。
本研究局限性在于:公开的数据集中MS基因表达数据大多来自于人体外周血,而人体脑组织基因表达数据相对较少,样本量小可能会导致结果的偏差。
总之,本研究使用了公共数据库的数据,分析方法不难,值得大家学习!