首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

云平台 | 轻松掌握PCA分析:云平台助力高效数据降维

_Origingene_

轻松掌握PCA分析云平台助力

高效数据降维

Cloud Tool Sharing

主成分分析(Principal Component Analysis,PCA)是一种常用的降维技术,旨在通过线性变换将数据从高维空间转换到低维空间,同时尽量保留数据的主要特征。它的核心目标是找出数据中最重要的方向(即主成分),并将数据投影到这些方向上,从而简化数据结构。PCA分析在各种组学分析中都有广泛应用,如基因组学、转录组学、代谢组学、蛋白质组学、为微生物组等组学研究。

案例1:人类颅面发育过程中转录组动力学的综合分析可识别候选疾病基因

英文标题:Integrative analysis of transcriptome dynamics during human craniofacial development identifies candidate disease genes

发表期刊:Nature Communications

发表时间:2023.08

技术策略:转录组+单细胞转录组

影响因子:14.7

颅面畸形发生于妊娠早期,是最常见的先天性缺陷之一。为了充分了解颅面疾病是如何发生的,有必要在颅面区域的模式形成过程中表征基因表达。为了解决这一问题,本研究从受孕后4 ~ 8周开始对人颅面组织进行了体积和单细胞RNA-seq。与其他几十个人类组织的比较表明,239个基因在颅面发育过程中表达最强烈。将此发现与颅面特异性增强子数据相结合,来预测发育中人脸中的增强子,基因共表达分析显示,调控枢纽富集于已知的致病基因,并且在正常健康人群中具有抵抗突变的能力。结合转录组学和表观基因组学数据,我们确定了539个可能导致颅面疾病的基因,这些基因在增加了口颌面裂患者中显著富集,通过主成分分析(PCA),发现第一个主成分反映了预期的发育时间,此外还确定了在CNCCs和CS13样本中相对于hESCs上调的基因数量。

图1 早期人类颅面发育的转录组学分析

案例2:代谢组学机器学习预测胃癌的诊断和预后

英文标题:Metabolomic machine learning predictor for diagnosis and prognosis of gastric cancer

发表期刊:Nature Communications

发表时间:2024.02

技术策略:靶向代谢组学

影响因子:14.7

胃癌(GC)是全球癌症相关死亡率的重要负担,迫切需要开发早期检测策略和精准的术后干预措施。然而,用于早期诊断和患者风险分层的无创生物标志物的识别仍有待探索。在本研究中,我们对来自多中心参与者的702份血浆样本进行了靶向代谢组学分析,以阐明GC代谢重编程。702名患者(GC vs NGC)血浆样本的代谢组学数据,总共检测到147种代谢物。主成分分析(PCA)能够区分GC和NGC样本,表明GC代谢组经历了重塑。进一步发现总共有45种代谢物在GC和NGC中有统计学差异。机器学习分析揭示了一个10代谢物GC诊断模型,该模型在外部测试集中得到了验证,灵敏度为0.905,优于利用癌症蛋白标志物的传统方法(灵敏度< 0.40)。此外,机器学习预后模型表现出优于使用临床参数的传统模型,并有效地将患者分层到不同的风险组,以指导精准干预。综上所述,本研究结果揭示了胃癌的代谢状况,并确定了两种不同的生物标志物,分别用于胃癌的早期检测和预后预测,从而促进胃癌的精准医疗。

图2 GC患者与非GC对照组相比的重编程血浆代谢情况

案例3:通过微生物组模型工程自然微生物组以增强生物修复

英文标题:Engineering natural microbiomes toward enhanced bioremediation by microbiome modeling

发表期刊:Nature Communications

发表时间:2024.06

技术策略:宏基因组

影响因子:14.7

由于对天然微生物组的代谢相互作用知之甚少,且缺乏微生物组工程的实用原理和工具,因此将天然微生物组工程应用于生物技术仍然具有挑战性。在此,我们提出了一种自上而下和自下而上相结合的框架来构建天然微生物群,以构建功能增强的合成微生物群。我们的研究表明,除草剂的施用和除草剂降解剂接种可以促进不同天然微生物群落向功能性微生物群落的趋同演替(例如,增强除草剂污染土壤的生物修复)。为了深入了解处理后微生物群落之间的功能差异,进行了宏基因组分析。分别选择了BO&7D-2&X-1处理的第30天和第0天样本来代表处理后和初始的微生物群落。PCA分析显示,处理后的微生物群落聚集在一起,并与初始微生物群落分开。我们开发了一个代谢建模管道SuperCC,可用于记录微生物组内的代谢相互作用,并模拟不同微生物组的性能。本研究以18种天然微生物为基础,利用SuperCC构建了生物修复增强的合成微生物群。我们的研究结果强调了代谢相互作用在塑造微生物组功能中的重要性,并为改造天然微生物组提供了实践指导。

图3 双成员菌群中代谢相互作用的模拟和实验验证

看完这些精彩案例,是否也激起了你亲自尝试的欲望?既然如此,何不动手实践一下呢?即便是生信“小白”,也能通过实践快速成长为生信“大神”!(注:以下示例用微生物组数据进行展示)

工具使用

1.登录元莘生物云平台官网:http://cloud.origin-gene.com/(推荐谷歌浏览器打开链接),检索PCA分析小工具。

2. 点击对应小工具进入工具分析界面,初次使用建议先仔细阅读帮助文档。

(PCA分析界面)

(PCA分析查看帮助界面)

3.根据设置的参数,准备对应的输入文件。可根据帮助文档中的输入文件说明或示例文件格式进行准备。文件要求如下图所示:

(物种丰度表)

(分组文件)

4. 输入上传文件。云平台提供两种上传文件方式,一种是从“文件中心”上传,另一种是通过“云工具参数-选择文件”上传。

方式一

方式二

5. 设置参数。数据文件上传完成之后,设置小工具的参数,包括基本参数和高级参数,可调整配色、置换多元方差、置信水平等参数。若不修改参数,使用系统默认参数即可。参数设置完成后,点击提交,界面跳转至“分析中心”,等待运行即可。

6. 结果查看。分析中心是任务进度的体现,主要展示了任务名称、工具名称、任务时间、任务状态等信息。

7. 结果解读。横坐标表示第一主成分,百分比则表示第一主成分对样品差异的贡献值;纵坐标表示第二主成分,百分比表示第二主成分对样品差异的贡献值。图中的每个点表示一个样品,同一个组的样品使用同一种颜色表示,在PCA分析图中,同组内的样本聚集成一簇,椭圆代表95%的置信区间,落在本组圆圈外的样本即为离群样本。如样品组成越相似,反映在PCA 图中的距离越近。注:坐标轴百分比解释:如果PC1 值为50%,则表示x 轴的差异可以解释全面分析结果的50%。

本期关于PCA分析的分享到这里就结束了,下期再会~

参考文献

[1] Yankee T N, Oh S, Winchester E W, et al. Integrative analysis of transcriptome dynamics during human craniofacial development identifies candidate disease genes[J]. Nature Communications, 2023, 14(1): 4623.

[2] Chen Y, Wang B, Zhao Y, et al. Metabolomic machine learning predictor for diagnosis and prognosis of gastric cancer[J]. Nature Communications, 2024, 15(1): 1657.

[3] Ruan Z, Chen K, Cao W, et al. Engineering natural microbiomes toward enhanced bioremediation by microbiome modeling[J]. Nature Communications, 2024, 15(1): 4694.

下期精彩继续

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O3SkcWAhTd25CObcFvHtSJBQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券