如今,随着科技的迅猛发展和人们生活水平的不断提高。生命科学研究领域已进入了大数据时代。无论是 DNA 序列,显微图片,还是质谱数据,研究人员都越来越需要对这些庞大的信息进行收集、整合、处理和诠释,对于很多专注于传统科研,而非计算机编程和数据统计的研究者们来说这绝非一件容易的事。
诺禾致源质谱事业部配备精湛的生物信息分析团队,经过团队小伙伴们的不懈努力,在原有信息分析的基础上,对蛋白质组与代谢组的标准分析、个性化分析、多组学关联分析进行再升级。在此,小编对其中多组学关联分析内容进行整理。
快跟小编一起看一下哪些信息分析点升级了~
诺禾致源蛋白质组&代谢组信息分析内容总览
图表中黑色字部分为已有信息分析项目,蓝色字部分为新升级信息分析内容。
是不是有点凌乱,不知该如何应用?
莫着急,小编就其中多组学关联分析内容给大家一一介绍。
微生物的数据进行关联分析,深度挖掘数据的生物学意义:
■ 相关性分析主要用于评价两种或两种以上组学的关联程度,能够在不同的组学水平层面得到相互印证;
■ 通路整合分析能够了解不同组学对通路的调控作用;
■ 互作网络图能够更进一步呈现出不同组学之间的相互作用关系,更能直观地了解到代谢物、酶、基因之间上、下游调控关系;
多组学关联分析内容如下图所示:
转录/蛋白与代谢关联分析
1. 转录/蛋白与代谢相关性分析
Pearson 相关性分析
转录组学/蛋白质组学与代谢组学的关联分析基于皮尔森相关系数进行相关性分析。
图1
代谢与转录相关性分析
横向为代谢物的聚类,纵向为基因的聚类。聚类枝越短代表相似性越高 ,颜色越红,正相关性越强。颜色越蓝,负相关性越强。注意:转录组与代谢组样本数目应保持一致。
典型相关分析(CCA)
典型相关分析(Canonical Correlation Analysis,CCA)研究的是两组变量之间的相关关系。借用 PCA 降维思想,把研究两组变量之间的相关问题转化为研究两个变量之间的相关问题。通过综合指标之间的线性关系研究代谢物与基因/蛋白各组变量间的相关关系。
图2代谢与蛋白/基因的CCA分析
蓝色代表代谢物,橙色代表基因/蛋白,内圈半径为相关性0.5的圆,外圈半径为相关性1的圆。任意一个代谢物、圆心、基因/蛋白组成的角为α,若 cosα>0(锐角)为正相关;相反,则为负相关;当 cosα=0(直角)时,代谢物与基因/蛋白不相关。
2. KEGG 通路关联分析
KEGG 是进行生物体内代谢、蛋白、转录分析及其网络研究的强有力工具,通过 Pathway 显著性富集能确定差异代谢物、差异蛋白/基因参与的主要生化途径和信号转导途径。
图3KEGG通路关联
横坐标为该通路中差异代谢物/基因与该通路中鉴定到的背景代谢物/基因的比值(Ratio),纵坐标为 KEGG 中相应的条目。
3. 互作网络分析
通过 MetScape 软件构建差异基因与差异代谢物的互作网络图,追踪代谢物和基因之间的联系,可视化化合物网络并显示化合物结构以及反应、酶、基因和通路的信息。同时,也能够对差异基因在更接近于表型的代谢层面进行验证。
图4 蛋白/基因与代谢互作网络图
微生物与代谢关联分析
差异物种与差异代谢物相关性分析
16S rRNA 或宏基因组学分析得到的显著差异菌群与代谢组学分析得到的显著差异的代谢物,基于皮尔森相关系数进行相关性分析,以表示环境样本中物种多样性与代谢物之间的关联程度。
图5 代谢物与微生物菌群相关性分析
横向为微生物的物种名称,纵向为代谢物的种类。不同颜色表示相关性大小,蓝色表示正相关,红色表示负相关,空白表示不具有显著性。
Scatter plot分析图
Scatter plot 分析图为了进一步验证某个代谢物与菌群或蛋白的相关性,从图中可以判断出代谢物与微生物物种或蛋白两个变量间的关系是正相关、负相关以及相关性的强弱。
图6 相关性分析Scatter plot图
横坐标为微生物物种相对丰度 top10 的总丰度值,纵坐标为某个代谢物的定量值。
多组学信息分析应用相关文献:
质谱事业部 陈浩浩丨文案
孙津津丨编辑
为你读文献
为你分享资源
为你分析研究思路
为你提供最前沿的科研动态
学霸,逗逼,科学家,文艺青年同在!
诺禾致源丨提供领先的基因组学解决方案
领取专属 10元无门槛券
私享最新 技术干货