前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >3分+非肿瘤纯生信免疫浸润分析还可以这么做!

3分+非肿瘤纯生信免疫浸润分析还可以这么做!

作者头像
百味科研芝士
发布2020-11-13 09:58:37
5.1K0
发布2020-11-13 09:58:37
举报
文章被收录于专栏:百味科研芝士百味科研芝士

大家好,今天小编分享的是今年3月份发表在Diagnostics (Basel)(IF:3.1)的一篇非肿瘤纯生信文章,本文作者通过挖掘GEO数据库中骨关节炎相关数据集,经差异分析,用LASSO回归和支持向量机法构建预测模型筛选出标志分子,此外还分析了OA中的免疫细胞浸润情况。文章思路简单,快来学习吧!

标题:RB10 and E2F3 as Diagnostic Markers of Osteoarthritis and Their Correlation with Immune InfiltrationGRB10和E2F3是骨关节炎的诊断标志分子并与免疫浸润相关

一. 研究背景

骨关节炎(Osteoarthritis,OA)是一种常见的关节疾病。医生通常经过临床诊断和图像技术判断患者是否患有OA,故而医生不能在OA早期做出诊断。故作者希望通过生信技术寻找OA的标志分子,建立OA早期的确诊手段,改善OA患者的诊断情况

二. 研究思路

三. 结果解读

1. 数据处理移除批次效应

作者合并了GSE55235和GSE55457两个数据集的表达矩阵,并用SVA包中的ComBat去除两个数据集间的批次效应。并给出Q-Q图以及去除批次效应前后的PCA分析图验证。

  • 图1:右侧给出正态Q-Q图以及负伽马Q-Q图。说明两个数据集间的批次效应被消除

图1. Q-Q图

  • 图2:A为移除批次效应前,因为批次效应的存在,两个数据集中的正常样本,OA样本明显分开,存在差异。B为处理批次效应后,只有正常样本和OA样本分隔开,而不同批次的样本间没分开,说明批次效应被移除

图2. 移除批次效应前后的PCA分析图

2. 差异表达分析识别DEGs
  • 图3:作者用limma包在OA与正常对照组间进行差异表达分析,DEGs(差异表达基因)的筛选条件是p<0.05,|logFC|>1。共识别出DEGs458个,图中红色表示表达上调,绿色表示表达下调

图3. 差异表达分析得到的火山图

3. 对DEGs进行功能富集分析

针对上文中筛选出的DEGs,作者用clusterProfiler包进行GO,DO以及GSEA分析

  • A:GO分析结果,白细胞转移,外界刺激应答等功能在DEGs中富集
  • B:DO分析结果,慢性淋巴细胞白血病,骨关节炎OA等疾病在DEGs中富集

图4. GO和DO分析结果

  • 图5:两个与免疫相关的通路在OA中富集,分别是PD1信号通路,ZAP-70向免疫突触转位信号通路。图中标出了通路中几个重要的人白细胞抗原(HLA-DPA1,HLA-DQA1,HLA-DPB1等),说明免疫应答在OA中起着重要作用

图5. GSEA分析结果

4. LASSO回归模型以及SVM-RFE识别OA标志分子
  • A:作者通过LASSO回归预测模型从DEGs中识别出14个标志分子
  • B:作者通过SVM-RFE(支持向量机递归特征消除)的算法,以样本DEGs的表达量作为输入,发现在特征基因数量位7时有最高的准确率(Accuracy=0.975)
  • C:将A和B中的标志分子取交集,最后得到GRB10和E2F3作为OA的标志分子
  • D:取数据集GSE51588与前两个数据集合并为一个作为验证集,用ROC曲线法检验两个标志分子的预测能力,AUC(曲线下的面积)接近于1,说明两个OA标志分子可靠

图6. 识别OA标志分子

5. 免疫细胞浸润的结果
  • A:作者用CIBERSORT算法评估了自己整和的芯片数据中的免疫细胞浸润情况,并得到22种免疫细胞的丰度值。通过PCA分析,发现OA和对照组的免疫细胞浸润情况有差异
  • B:相关性热图展示了OA中22种免疫细胞的相关性,作者对其中高度相关的免疫细胞做了说明
  • C:小提琴图展示22种免疫细胞特征基因在OA和对照组间表达差异(红色表示OA,蓝色表示正常对照)。横坐标轴中红色标记了在OA和对照组中存在显著差异的免疫细胞

图7.免疫细胞浸润的结果

6. 分析GRB10,E2F3与浸润免疫细胞的相关性
  • A:分析OA中GRB10的表达量与22种免疫细浸润胞的特征基因表达量相关性
  • B:分析OA中国E2F3的表达量与22种免疫细浸润胞的特征基因表达量相关性

图8. 分析两个OA标志分子与免疫浸润细胞的相关性

小结

本文用生信手段挖掘GEO数据库中OA相关数据集,先合并两个数据集消除批次效应从而扩大样本量,接着经差异表达分析找到DEGs并进行功能富集分析。针对DEGs用LASSO回归模型和SVM-REF两种分类法寻找OA标志分子。最后作者用CIBERSORT算法分析了OA中22种免疫细胞浸润情况,并分析与两个标志分子的相关性。本文的工作量不多,思路也很简单,值得我们学习!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-11-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 数据处理移除批次效应
  • 2. 差异表达分析识别DEGs
  • 3. 对DEGs进行功能富集分析
  • 4. LASSO回归模型以及SVM-RFE识别OA标志分子
  • 5. 免疫细胞浸润的结果
  • 6. 分析GRB10,E2F3与浸润免疫细胞的相关性
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档