首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

go富集分析和kegg富集分析的区别_非模式生物怎么做GO富集

首先考虑一个问题:clusterProfiler做GO和KEGG富集分析的注释信息来自哪里? GO的注释信息来自Bioconductor,提供了19个物种的org类型的GO注释信息,如下表所示。...以上都是有物种信息的情况,那么对于无物种信息的项目怎么办? GO可以通过读取外部的GO注释文件进行分析。...clusterProfiler需要导入的GO注释文件的格式如下: GeneID GO GO_Description 1 GO:0005819 spindle 2 GO:0072686 mitotic spindle...同样地,对于pathway数据库中没有的物种,也支持读取基因的pathway注释文件,然后进行分析,注释文件的格式如下: GeneID Pathway Path_Description 1 ko:00001...maxGSSize = 500, pvalueCutoff = 0.05, verbose = FALSE) #通过导入外部注释文件富集分析参考代码: data <- read.table

2K60

GWAS分析中的GO和KEGG富集分析教程

大家好,我是邓飞,上一次,我们介绍如何根据显著性snp,使用bedtools根据上下游距离,根据gff文件注释基因。...(使用bedtools进行gwas基因注释) 这一次,介绍一下如何根据注释的基因,进行富集分析,主要是看一下GWAS定位的基因有没有某一个趋势,也算是一种验证的方法。...之前用于注释基因需要的gff文件: 上面红框中就是基因的名字,这里,我们已经注释到的基因,形成一个txt文件,内容如下: 1....KEGG富集分析 把基因型的ID后面加上“-01”,并且把g变为t rap_id <- paste0(geneid, "-01") rap_id <- gsub("g","t",rap_id) head...(rap_id) 富集分析: geneid = read.csv("a1.txt",header = F)$V1 rap_id <- paste0(geneid, "-01") rap_id <-

61240
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    GWAS分析中的GO和KEGG富集分析教程

    大家好,我是邓飞,上一次,我们介绍如何根据显著性snp,使用bedtools根据上下游距离,根据gff文件注释基因。(显著SNP的基因注释教程!)...这一次,介绍一下如何根据注释的基因,进行富集分析,主要是看一下GWAS定位的基因有没有某一个趋势,也算是一种验证的方法。...之前用于注释基因需要的gff文件: 上面红框中就是基因的名字,这里,我们已经注释到的基因,形成一个txt文件,内容如下: 1....KEGG富集分析 把基因型的ID后面加上“-01”,并且把g变为t rap_id <- paste0(geneid, "-01") rap_id <- gsub("g","t",rap_id) head...(rap_id) 富集分析: geneid = read.csv("a1.txt",header = F)$V1 rap_id <- paste0(geneid, "-01") rap_id <- gsub

    34310

    使用clusterProfiler包利用eggnog-mapper软件注释结果做GO和KEGG富集分析

    后来发现不构建orgdb也可以做GO或者KEGG的富集分析,可以使用enricher()函数。...下面记录利用eggnog-mapper软件注释结果做GO和KEGG富集分析做GO和KEGG富集分析的过程。..._protein.faa --output orgdb_example/out -m diamond --cpu 8 将注释结果下载到本地,手动删除前三行带井号的行,第四行开头的井号去掉,文件末尾带井号的行去掉...GO富集分析了 在 https://www.jianshu.com/p/9c9e97167377 这篇文章里的评论区有人提到上面用到的for循环代码效率比较低,他提供的代码是 gene_ids 的输入文件是eggnog-mapper软件本地版注释结果,如果用在线版获得的注释结果,下载的结果好像没有表头,需要自己对应好要选择的列。

    11.1K42

    单细胞功能注释和富集分析(GO、KEGG、GSEA)(2021公开课配套笔记)

    新课发布在B站了,马上有热心的粉丝看完后写了配套笔记: 下面是粉丝linbo的笔记投稿 多个亚群各自merker基因联合进行GO以及KEGG分析 在前面几节我们已经知道各个细胞亚群的maerker基因,...接下来我们对这些marker基因进行功能注释和富集分析。...image-20210609131444112 同样的进行GO功能注释 ## GO xx <- compareCluster(gcSample, fun = "enrichGO", OrgDb...image-20210609132922387 差异分析后的GO以及KEGG分析 具体差异分析方法前面已经讲过,经过差异分析后会得到上下调基因,此时可对上下调基因进行GO和KEGG分析。...image-20210609135928006 差异分析后的GSEA分析 ## 上一步差异分析得到差异基因列表deg后取出,p值和log2FC nrDEG = deg[,c('avg_log2FC',

    17.5K78

    详解GO的层级关系在富集分析中的应用

    做完富集分析后,我们可能会得到几百甚至几千个富集到的GO terms, 这样的一个数据量对于人工一个个检索而言,仍然是一个艰巨的任务。...为了有效的利用GO富集分析的结果,我们势必需要对结果再次进行过滤。 所有GO的层次结构关系如下图所示 ?...,GSEA也罢,这些富集分析的算法都只是为单个GO term进行分析,不会考虑该GO term在整个网状结果中的层级关系。...根据所有富集到的GO terms, 从整个GO Graph中取出一个子图subgraph, 图中有颜色的节点为富集到的GO, 颜色的深浅有P值决定, 节点的大小由degree决定。...根据这个network, 应用图论的算法可以挖掘出其中重要的GO term,从而实现对GO富集结果的过滤。 ·end· —如果喜欢,快分享给你的朋友们吧—

    3K20

    R语言GOplot画弦图展示GO富集分析的结果之如何准备自己的数据

    我们首先运行帮助文档里的例子看例子里画图用到的数据是什么样子的 查看帮助文档 help(package="GOplot") 运行示例数据获得画弦图的数据 library(GOplot) circ 富集分析的结果,部分结果截图如下 ?...image.png 这个结果我们需要用到的是Term和genes两列 感兴趣的Term,单独一个文件 ? 感兴趣的基因,单独一个文件 ?...image.png 这个地方如何用R语言来实现我暂时还想不出来了,我试着写python脚本吧 首先是将感兴趣的term添加到一个列表里 fprocess = open("process.txt",'r'...欢迎大家关注我的公众号 小明的数据分析笔记本 小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记

    2.4K20

    GO富集分析可视化:GOplot~准备自己的数据—2

    最近在学习使用GOplot这个包中的GOChord()函数可视化GO富集分析结果,又有了一点收获,记录在这里。...通过help(package="GOplot")查看帮助文档中的例子,这个例子中他准备了4数据 EC$david david的GO富集分析结果 EC$genelist 这个是R语言包limma做差异表达分析得到的结果...,其中的t和B是什么意思我还没有搞明白 EC$genes 这个数据包含两列,一列是感兴趣的基因名,一列是logFC的值 EC$process 自己感兴趣的GO term 例子中通过两个函数将这些数据整合到一起...image.png 最后的结论就是只要有了GO或者KEGG富集分析的结果,都可以GOChord()这个函数来画图。...如何整理GO或者KEGG的富集分析结果为GOChord()函数的输入格式我还得好好想想。

    1.6K20

    使用topGO进行GO富集分析

    topGO是一个专门用于做GO富集分析的R包,它默认从GO.db中读取GO的分类和结构信息,结合富集分析的结果,它可以画出如下所示的GO有向无环图 ?...除了GO富集结果可视化这一特点,topGO还提供了多种富集分析的统计方法,示意如下 ? 甚至支持自定义统计算法和模型,当然,常规情况下我们使用经典的费舍尔精确检验就可以了。...基因的GO注释,可以从Bioconductor提供的注释包中获得,比如human就可以从org.Hs.eg.db包中得到,如果没有现成的注释包,也可以从文件中读取。...annot指定基因对应的GO注释如何读取,annFUN.org代表从Bioconductor提供的org.xx.xx.db包中读取,mapping指定org包的名字,ID指定基因标识符的类型。...对于那些没有现成的注释包的物种,可以从文件中读取所有基因的GO注释信息,文件内容示例如下 121005 GO:0005576 155158 GO:0005488 160828 GO:0005488

    3.2K42

    详解如何获取物种所有基因对应的GO注释

    Gene Ontology是研究基因功能的重要数据库之一,在进行GO的富集分析时,需要提供所有基因对应的GO注释信息,本文介绍几种获取该信息的方式。 1....从GOA项目进行下载 EBI对uniprot数据库中的蛋白进行了GO注释分析,这个项目名为gene ontology annotation, 简称GOA, 在FTP也提供了物种对应的注释信息,示意图如下...gene2go就是基因对应的GO注释文件,这个文件包含了所有物种的GO信息,可以根据物种对应的tax id提取指定物种。...以org.Hs.eg.db为例,这个R包存储了很多human基因对应的信息,通过keys和select函数可以获得基因对应的GO注释信息,代码如下 > k 富集分析的包就会从物种对应的db包中读取GO注释信息。 ·end· —如果喜欢,快分享给你的朋友们吧—

    9.6K20

    使用R语言的clusterProfiler对葡萄做GO富集分析的简单小例子

    Hiast2 比对 samtools sam 转bam stringtie组装转录本 gffcompare将stringtie输出的gtf文件与参考基因组的注释文件做比较得到一- 个merged.combine.gtf...使用merged.combine.gtf 这个文件对每个样本计算表达量,输出文件存储到ballgown文件夹下,这一步用到的命令是 stringtie -e -B -p 8 -G merged.combined.gtf...ENTREZID ,这里需要借助对应的gtf注释文件 这里只关注蛋白编码基因 grep 'gene_biotype "protein_coding"' 12X_genomic.gtf > 12X_protein_coding.gtf...富集分析的R语言代码 require(AnnotationHub) hub<-AnnotationHub() #这一步对网路有要求 # aa<-query(hub,'zea') # aa$title #...image.png image.png 欢迎大家关注我的公众号 小明的数据分析笔记本 小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学

    1.2K30

    GO富集分析可视化:R语言GOplot包——准备自己的数据

    GO注释和富集分析 GO注释和富集分析使用TBtools完成,具体步骤可以参考TBtools作者在腾讯课堂开设的一系列视频课程 本文使用的数据是甜樱桃叶绿体蛋白编码基因做GO注释,然后挑部分基因做富集分析...rps15 rps14 rps18 做完富集分析得到文件GOenrichmentOutput.txt..GO.Enrichment.final.xls 根据GOplot包的示例数据挑选出其中的5列...Class GO_Name GO_ID GenesOfSelectedSetInGOterm corrected p-value(BH method) 作为数据集1 数据集2包括 ID,logFC,AveExpr...,t,P.Value,adj.P.Val,B 数据集2的列变量应该都是转录组数据分析的结果 比如logFC应该是倍数变化Fold change 然后取log AveExpr应该是平均表达量等 然后模仿帮助文档的例子构造数据集...image.png 现在基本可以根据自己的数据来构造GOplot的输入文件,但是作图的具体细节还需要调整

    3.1K10

    【R语言】clusterProfilerf富集分析,物种注释数据库

    其实小编前面已经花了不少篇幅给大家介绍过如何使用这个R包做GO富集分析和结果可视化,以及如何将富集结果中的gene ID转成基因名字 ☞GO富集分析四种风格展示结果—柱形图,气泡图 ☞GO和KEGG富集结果如何显示基因...☞GO和KEGG富集分析线上课程 我们知道一般做富集分析,都需要有一个注释数据库。...一般我们对人这个物种中的基因做富集分析的时候,都会用到org.Hs.eg.db这个注释数据库,Hs代表的是human。小编也讨论过如何安装这个注释数据库。...,如小鼠,大鼠,线虫等等,其他物种的注释文件该如何获取呢?...可以从下面这个网页中查找,每一行代表一个物种的注释文件。

    1.5K30

    富集分析:GSEA 分析介绍

    分析的是基因集合而非单个基因(GO)或少数基因(Pathway); 3. 富集分析。 怎么理解这个富集分析?...四、与传统富集分析的区别 GO 富集分析通过分析差异基因在生物学过程,分子功能、细胞组成中的富集定位,从而对基因进行注释和分类,它通过设定 cut-off 值选出差异表达基因,对它们进行 GO...结果分析是第四部分。 准备格式无误的文件是富集分析成功的关键,需要准备 4 种文件,分别为表达数据集、样品分组信息、基因数据集,基因芯片注释。...链接: https://www.gsea-msigdb.org/gsea/msigdb/ 基因芯片注释:不同测序或芯片平台所用的基因代码不一样,因此需要基因芯片注释文件来说明基因代码究竟是哪个基因...六、结果解读 分析完成后会获得一个文件夹,里面有许许多多的图表。

    5.8K50

    展示DAVID富集分析结果中感兴趣的GO条目和KEGG通路

    相信大家对GO和KEGG富集分析并不陌生,有时候富集分析会得到很多显著的结果。全部展示,版面不够。...关于DAVID这个工具,小编前面也用了好几期的内容来给大家介绍。如何使用DAVID做GO和KEGG富集分析,并且给大家演示了如何使用Excel,零代码展示GO和KEGG富集分析的结果。...(四)-GO富集分析及柱形图展示 5.零代码GO富集分析—柱形图同时展示BP,MF,CC,KEGG 6.零代码GO富集分析—一张图展示BP,MF,CC 也给大家介绍了,使用R语言来展示DAVID富集分析的结果...☞【R】四种风格展示DAVID GO富集分析结果 ☞ 【R语言】DAVID KEGG富集分析结果可视化 如果把上面的内容都理解了,展示部分结果就是手到擒来的事情。...只需要三步 1)下载DAIVD富集分析完整结果 GO富集分析结果 KEGG富集分析结果 2)挑出自己感兴趣的GO条目或者KEGG通路 这一步又有两种方法,第一种是做加法,从完整的结果里面挑出感兴趣的结果

    2.1K31
    领券