专栏首页科研猫干货预警:3分钟搞定GO/KEGG功能富集分析(2)

干货预警:3分钟搞定GO/KEGG功能富集分析(2)

在 【3分钟了解GO/KEGG功能富集分析】 一文中给大家讲解了GO和KEGG的基本概念和内涵,并且给大家介绍了DAVID这一神奇网站。今天我们就把GO/KEGG功能富集分析的详细教程按部就班地呈现给大家,有请小猎豹。

1

Step1:

打开DAVID官网:https://david.ncifcrf.gov/

点击左侧功能菜单:Functional Annotation

进入到如下页面中,页面中的红框中就是进行分析所用的主要操作区域。

2

Step2:

进入分析页面后,通过如下三步即可完成分析:

提交基因列表->选定提交列表类型->开始分析

具体操作如下:

(1) 在“Enter Gene List”中上传基因列表,格式是每行一个基因。按照DAVID的要求,总的基因个数不得超过3000个。

(2) 在“Select Identifier”中选择上传的基因类型,因为我们上传的是基因名(Gene Symbol),所以在下拉菜单中选择“OFFICIAL_GENE_SYMBOL”(下拉菜单比较长,可能不太好找,keep patient ~)

(3) 在“List Type”中有两个单选框,我们统一选择“Gene List”这一项。

(4) 点击“Submit List”即可。

点击“Submit”提交基因列表之后,经过几秒钟的等待,如果分析顺利,就会弹出下面一个提示(如下图左所示):Please note that multiple species have been detected in your gene list. 这句话的意思就是在我们提交的基因列表中检测到多个物种,需要我们选择相应的物种。怎么选择物种?点击弹出框中的“确定”,然后在“List”中的选择相应的物种,这里我们选择“Homo sapiens”,并点击下方的“Select Species”即可。

3

Step3:

操作完成后,就可以得到如下图所示的分析结果。红框所示折叠框中分别就是GO(包括BP,CC和MF,还记得这三个分别是什么吗?不知道的话请参考我们上次的文章 3分钟了解GO/KEGG功能富集分析 )和KEGG的结果。

4

Step4:

做完了分析,我们就来看看如何提取结果,并实现结果的可视化吧。如下图所示,在功能富集分析的结果中有多个折叠栏,其中Gene_Ontology (3 selected)这一折叠栏中有三个栏目(蓝框):GOTERM_BP_FAT、 GOTERM_CC_FAT、 GOTERM_MF_FAT就是是我们想要的GO功能富集分析结果。而Pathways (3 selected)里面有一个KEGG_PATHWAY(蓝框)就是我们想要的结果。如何找到BP、CC、MF和KEGG对应的详细结果呢?点击每个栏目后面的“Chart”即可(绿框所示)。

点击“Chart”之后,即可出现如下图所示的结果,这里面有几列数据分别是:Category、Term、RT、Genes、Count、%、P-Value和Benjamini。这几列数据中我们比较关心的是:Term(GO语义)和P-Value(P值),其次就是Count(基因数)和% (基因比例)。后面我们要解决的问题是,如何将这些结果下载下来?点击红框中的Download File即可。打开一个新的网页,新打开的网页(貌似一堆乱糟糟的东西)就是分析结果的文本文件,可以下载或者导入到作图软件中进行后续的操作。

5

Step5:

结果导出和可视化。

不知道各位科研喵们在看文献的时候曾经看到过什么样子的结果呢?有没有见过柱状图,或者高级的气泡图呢?听说很多人还在用Excel或者PPT作图?

下面这样的图,是不是很好看很高级呢?

-END-

本文分享自微信公众号 - 科研猫(DoctorTommy)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-02-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 3分钟了解GO/KEGG功能富集分析

    “大数据”、“组学”、“数据挖掘”是近几年来我们经常听到的词汇,科研工作中也经常用到二代测序,不管送哪家测序公司进行测序或数据分析,结题报告中都会看到一个标准的...

    用户6317549
  • 终极篇:3分钟搞定GO/KEGG功能富集分析-柱状图

    在干货预警:3分钟搞定GO/KEGG功能富集分析(2),给大家详细讲解了DAVID网站的使用,通过分步操作,带领大家学习了使用DAVID工具来进行GO和KEGG...

    用户6317549
  • 终极篇:3分钟搞定GO/KEGG功能富集分析-气泡图

    干货预警:3分钟搞定GO/KEGG功能富集分析(2),给大家详细讲解了DAVID网站的使用,通过分步操作,带领大家学习了使用DAVID工具来进行GO和KEGG分...

    用户6317549
  • 使用Loupe Cell Browser查看10X单细胞转录组分析结果

    10X genomics公司不仅为单细胞转录组数据分析提供了配套的cell Ranger软件,同时也提供了专门的分析结果查看软件-Loupe Cell Brow...

    生信修炼手册
  • GWAS ATLAS:最全面的GWAS数据库

    GWAS ATLAS数据库收录了来自4756个人类不同表型的GWAS结果,并进行了不同表型间的遗传相关性分析,对应的文献发表在nature genetics上,...

    生信修炼手册
  • 不编程就能完成差异表达分析

    上几周,生信技能树的元老级人物果子发了一篇重量级文章数据库一网打尽:不会编程又怎样,还不照样拿课题发文章! 阅读量逼近4000,还超过了Jimmy的署名文一个全...

    生信技能树
  • matplotlib散点图笔记

    open,close=np.loadtxt(‘000001.txt’,delimiter=’,’,skiprows=1,usecols=(1,4),unpack...

    用户2398817
  • 十大最受欢迎的人工智能模型

    企业面临的问题种类繁多,用于解决这些问题的ML模型种类繁多,因为有些算法比其他算法更擅长处理特定类型的问题。因此,我们需要清楚地了解每种ML模型的优点,今天我们...

    程序你好
  • python 字符串的split()函数详解

    split翻译为分裂。  split()就是将一个字符串分裂成多个字符串组成的列表。

    于小勇
  • 业界 | 数据科学家“恐怖故事”

    文字语音转换圈内流传这么一则真假未知的故事:一个研究者花了数月(甚至数年)调整他/她的语音生成模型,使其语音样本听起来效果非常好。最后他们发现,他们从头到尾都误...

    大数据文摘

扫码关注云+社区

领取腾讯云代金券