通过GWAS分析可以识别到与性状关联的SNP位点,然而从生物学角度出发,我们更想了解的是哪些基因或者通路导致了这些位点与性状的关联现象。为了解决这一问题,科学家们发明了DEPICT
这款软件,通过预测基因的功能来对GWAS的结果进行解释。
通过该软件, 可以进行以下几种分析
一句话总结,就是从基因对应的功能,pathway以及表达的位置来解释GWAS结果。相关的文章发表在nature communications上,链接如下
https://www.nature.com/articles/ncomms6890
官网如下
https://data.broadinstitute.org/mpg/depict/
其分析过程示意如下
可以分为以下4大步骤
该软件所有内置的数据都包含在了源代码包中,所以源码包有2.9G之大,直接下载即可使用。用法如下
该软件的可执行脚本名为depict.py
, 修改参数需要直接编辑这个文件,在软件的开头有部分代码需要自定义,示意如下
通常只需要修改前3个参数即可,param_analysislabel指定输出结果文件的前缀,path_snpfile指定gwas结果中显著关联的SNP位点,每行为一个rs号,path_results指定输出结果所在的文件夹。
参数定义好之后,直接运行该脚本即可,代码如下
python depict.py
输出结果为多个文件,后缀为loci.txt
文件保存了SNP位点对应的基因信息,内容示意如下
后缀为genesetenrichment.txt
的文件保存了候选基因的基因集富集分析结果,内容示意如下
后缀为tissueenrichment.txt
的文件保存了候选基因的组织/细胞富集分析结果,内容示意如下
后缀为geneprioritization.txt
的文件保存了候选基因的排序结果,按照p值从小到大排序,内容示意如下
和MAGMA等gene-based关联分析工具不同,DEPICT提供了一种新的思路,来识别gwas结果中值得深入挖掘的候选基因,并对这些基因的重要性进行排序。