前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >“个性化”GSEA分析 - Do GSEA with specified gene set

“个性化”GSEA分析 - Do GSEA with specified gene set

作者头像
用户6317549
发布2020-03-31 11:57:01
3.8K0
发布2020-03-31 11:57:01
举报
文章被收录于专栏:科研猫
在上次的GSEA教程(“便携式”GSEA分析 - Do GSEA without "GSEA

首先,让我们再简单回顾下GSEA的操作过程,(1)我们需要按顺序排列好的gene list用于分析,(2)需要参考基因集pre-defined gene set,那么这个从哪里来呢?这么跟大家说吧,在GSEA中富集出来的基因功能类或者基因集合都是提前定义好的,谁定义的呢?当然是GSEA官方或者一些权威数据库(比如KEGG通路数据库,Gene Ontology数据库等)。举个例子,有哪些基因隶属于p53 signaling pathway或者MAPK singaling pathway是不需要我们操心的,有专家已经帮我们定义好了。那么,如何去查看或者下载这些预定义好的基因集合呢?打开如下链接:

  • https://www.gsea-msigdb.org/gsea/index.jsp

上面就是GSEA的官方网站的主页,如何找到我们感兴趣的基因集呢?如下图操作,找到MsigDB(Molecular Signatures Databases),这里面包含了GSEA定义的所有基因集,分为八个大类,分别由“H"和“C1”-“C7”开头,每个大类中都包含了哪些基因集在网页中有详细解释。比如C6是肿瘤相关,C7是免疫相关。

点击进去之后,有每个部分的详细描述,我们可以根据自己的需求选择特定的基因集。

这里我们选择Hallmark gene set作为示例,通过其官方定义,我们知道该基因集是通过共表达模式定义了50个特定生物学过程或状态。为了将其用于后续的分析,我们可以将其下载下来。点击下图红色框中的链接即可下载gmt格式的基因集。

这个gmt文件里面是什么内容呢?我们可以把它用Excel表格打开看一眼。可以看到这个文件中每一行是一个基因集,第一列是基因集的名字,第二列是官网链接,后面的所有列就是该集合中包含的基因了(当然,这里是基因的Entrez ID)。

实例演练

现在给大家演示如何用特定的.gmt文件(基因集合)进行GSEA分析,我们还是用上次的数据集(没有测试数据的同学,可以在文末联系客服小姐姐领取)。我们先讲第一种方法:还是使用clusterProfiler包进行分析,代码如下,在计算出来的结果中,我们可以选择前10个富集出来结果绘制气泡图,同时选择第一个基因集合INTERFERON GAMMA RESPONSE绘制gsea图:

代码语言:javascript
复制
#clusterprofiler
pathway<-read.gmt("h.all.v7.0.entrez.gmt")
y <- GSEA(gene,TERM2GENE =pathway)
dotplot(y,showCategory=10)
gseaplot2(y,"HALLMARK_INTERFERON_GAMMA_RESPONSE",color = "red",pvalue_table = T)

如果你看倦了气泡图和GSEA图,在这里我们也给大家提供了另外一种方式,通过fgsea包选择特定基因集合进行分析,代码如下:

代码语言:javascript
复制
#fgsea
pathways<-gmtPathways("h.all.v7.0.entrez.gmt")
fgseaRes <- fgsea(pathways, gene, nperm=1000,minSize=15, maxSize=500)
topPathwaysUp <- fgseaRes[ES > 0][head(order(pval), n=10), pathway]
plot.new()
plotGseaTable(pathways[topPathwaysUp], gene, fgseaRes, gseaParam=0.5)

绘制出来的图形和结果如下所示,个人认为这种结果看上去更加简洁明了,我们最关心的NES、p value、adjusted p value以及Gene Ranks的缩略图都在图表中了。

好了,关于定制化的万能GSEA分析到这里告一段落,对于我们上次教程提出的问题,如果你想做免疫相关通路的GSEA,现在可以动手尝试起来喽。最后回顾一下,既然通路是由基因集组成的,我们自然可以选择我们想要研究的通路进行富集,同样那么在我们遇到一些崭新问题的时候,是不是也可以自己“制作”参考基因集呢?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科研猫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 点击进去之后,有每个部分的详细描述,我们可以根据自己的需求选择特定的基因集。
  • 这里我们选择Hallmark gene set作为示例,通过其官方定义,我们知道该基因集是通过共表达模式定义了50个特定生物学过程或状态。为了将其用于后续的分析,我们可以将其下载下来。点击下图红色框中的链接即可下载gmt格式的基因集。
  • 好了,关于定制化的万能GSEA分析到这里告一段落,对于我们上次教程提出的问题,如果你想做免疫相关通路的GSEA,现在可以动手尝试起来喽。最后回顾一下,既然通路是由基因集组成的,我们自然可以选择我们想要研究的通路进行富集,同样那么在我们遇到一些崭新问题的时候,是不是也可以自己“制作”参考基因集呢?
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档