昨天给大家简单的介绍了一下富集分析的常见算法(基因富集分析算法介绍),但是具体要怎么实现基因的富集分析呢?今天给大家推荐个软件,
WebSestalt (http://www.webgestalt.org)
PS:如果会R语言,当然还是首推clusterprofiler的,毕竟业界公认的好呀。
>>>> WebSestalt简介
WebSestalt 全称为WEB-based Gene SeT AnaLysis Toolkit。翻译过来也就是,基于网页的基因集的分析工具。由于基于网页嘛,所以就会很简单的入手。从这个数据库的更新来看,这个数据库有13,17,19版本,所以还是在一直更新的,结果的质量还是有一定保证的。这样对于不会编程的人而言,也是可以很容易上手的。
根据我们之前介绍的三种富集分析的算法,这个数据库也同样基于三种算法分成了三个功能。
>>>>
数据的输入主要包括两个方面,一个就是基本的参数,我们要选择对什么物种做什么分析;另一个就是输入符合要求的格式即可。
数据库的基本参数包括:
这个数据库支持包括人和老鼠在内的十多种物种。如果没有的话,也可以自己上传物种的数据集来构建自己的小物种数据。
之前介绍的三种富集分析方式都可以进行选择。我们可以基于自己想要的分析方式来进行选择。
这里我们需要选择背景数据库。除了常见的GO和Pathway,还包括疾病、药物等其他的背景数据集。
由于我们经常想要做很多方面的富集分析,网站很贴心的也有了一个添加背景数据集的按钮。我们通过 + 也就可以添加额外的数据了。
对于不同的基因分析方式需要输入的基因集不同,其中 ORA 和 NTA 需要输入的都是候选的基因名即可,而 GSEA 则需要输入全基因所有基因的名和相对于的变化倍数。
>>>>
GSEA分析的结果都包括两个方面:一个是整体数据的总结,另外一个就是具体结果的可视化。
2.1 总体数据汇总
网站提供了三种总体数据汇总的方式:表格 、柱状图 以及 火山图 。
如果我们想要查看具体的某一个通路或者什么的具体信息,那就可以在下面输入相对应的通路号即可。
网络分析的结果主要是通过亚网络的格式展示的。在这里我们可以看到具体的信息同时也可以看到网络中基因的富集结果。
>>>>
对于任何的分析结果。我们都是可以通过结果界面的结果下载来下载结果的