前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >🤒 GSEAmining | 来看看你的GSEA结果是不是需要瘦身啦!~

🤒 GSEAmining | 来看看你的GSEA结果是不是需要瘦身啦!~

作者头像
生信漫卷
发布2023-03-08 16:49:28
4230
发布2023-03-08 16:49:28
举报

1、写在前面

最近真是累的不行,今天抽空写一下新的教程,关于人人都会做的GSEAGene Set Enrichment Analysis)。

但有时候我们做完GSEA后结果实在太多,无法确定其中重要的生物学意义,难以解释。🤨

本期我们介绍一下GSEAmining包,对我们的GSEA结果做一个瘦身吧,基本原理是:👇

1️⃣ 对参与类似生物过程的基因集应该有共同的基因。 2️⃣ 对拥有一定数量的共同基因的相似基因集进行功能聚类。

2、用到的包

代码语言:javascript
复制
rm(list = ls())
# if (!requireNamespace("BiocManager", quietly = TRUE))
#     install.packages("BiocManager")
# 
# BiocManager::install("GSEAmining")

library(dplyr)
library(GSEAmining)
library(clusterProfiler)
library(msigdbr)
library(org.Hs.eg.db)

3、示例数据

这里我们从DOSE包里提取一些基因,作为我们的genelist,假装是我们的输入数据。😙

代码语言:javascript
复制
data(geneList, package="DOSE")
gene <- names(geneList)[abs(geneList) > 2]

# Entrez gene ID
head(gene)

4、整理gmt

这里我们用msigdbr包提取一下hallmarkGOKEGG的基因集。🤒

再也不用去下载gmt文件了,真香!~😂

代码语言:javascript
复制
h_t2g <- msigdbr(species = "Homo sapiens", category = "H") %>% 
  dplyr::select(gs_name, entrez_gene)

C2_t2g <-  msigdbr(species = "Homo sapiens", category = "C2", subcategory = "CP:KEGG") %>% 
  dplyr::select(gs_name, entrez_gene)

C5_t2g <- msigdbr(species = "Homo sapiens", category = "C5") %>% 
  dplyr::select(gs_name, entrez_gene)

all_t2g <- rbind(h_t2g, C2_t2g, C5_t2g)

head(all_t2g)

5、GSEA分析

5.1 开始GSEA

代码语言:javascript
复制
GSEA.res <- GSEA(geneList, TERM2GENE = all_t2g, pvalueCutoff = 0.1, eps = 0)

5.2 将ID转为SYMBOL

代码语言:javascript
复制
GSEA.res <- setReadable(GSEA.res, keyType = "ENTREZID", OrgDb = "org.Hs.eg.db")

dat <- GSEA.res@result

5.3 过滤一下

这里我们设个阈值,过滤一下,实在是太多了。😂

代码语言:javascript
复制
gs.filt <- gm_filter(dat, 
                     p.adj = 0.05, 
                     neg_NES = 2.5, 
                     pos_NES = 2.5)

6、聚类

6.1 开始聚类

这里我们进行一下hierarchical clustering,对富集结果进行一下瘦身。🤨

补充一下,这一步是基于core_enrichment的。😷

代码语言:javascript
复制
gs.cl <- gm_clust(gs.filt)
gs.cl

6.2 初步可视化

画个cluster dendrogram吧, 红色 ➡️ positive, 蓝色 ➡️ negative。😙

代码语言:javascript
复制
gm_dendplot(gs.filt, 
            gs.cl)

6.3 改个颜色

代码语言:javascript
复制
gm_dendplot(gs.filt, 
            gs.cl, 
            col_pos = 'orange', 
            col_neg = 'black', 
            rect = T,
            dend_len = 20, 
            rect_len = 1)

7、分组评估富集结果

这里我们按cluster对各个cluster进行一下深入分析,看看那个term才是最重要的。🤩

7.1 分组分析

这里我们有4cluster,看看都是什么term吧。😁 我们用词云的方式展示下结果,越大越有意义。🧐

代码语言:javascript
复制
gm_enrichterms(gs.filt, gs.cl)

7.2 不分组分析

当然你也可以不按cluster分析,全部都放在一起。😂

代码语言:javascript
复制
gm_enrichterms(gs.filt, 
               gs.cl, 
               clust = F,
               col_pos = 'chocolate3',
               col_neg = 'skyblue3')

8、分组评估具体基因

对于找到的有意义的基因集,我们也可以看下哪个基因对其贡献最大,在其中起到最重要的作用。😏

代码语言:javascript
复制
gm_enrichcores(gs.filt, gs.cl,
               col_pos = 'chocolate3',
               col_neg = 'skyblue3')

9、如何引用

📍 Arqués O (2022). GSEAmining: Make Biological Sense of Gene Set Enrichment Analysis Outputs. R package version 1.8.0.


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信漫卷 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、写在前面
  • 2、用到的包
  • 3、示例数据
  • 4、整理gmt
  • 5、GSEA分析
    • 5.1 开始GSEA
      • 5.2 将ID转为SYMBOL
        • 5.3 过滤一下
        • 6、聚类
          • 6.1 开始聚类
            • 6.2 初步可视化
              • 6.3 改个颜色
              • 7、分组评估富集结果
                • 7.1 分组分析
                  • 7.2 不分组分析
                  • 8、分组评估具体基因
                  • 9、如何引用
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档