前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >你没看错,搞定GWAS meta分析只需一行代码!

你没看错,搞定GWAS meta分析只需一行代码!

作者头像
生信修炼手册
发布2019-12-17 16:25:31
3.2K1
发布2019-12-17 16:25:31
举报
文章被收录于专栏:生信修炼手册生信修炼手册

METAL是gwas meta分析最常用的工具之一,官网如下

https://genome.sph.umich.edu/wiki/METAL

该软件的安装非常简单,直接下载编译好的二进制文件即可,安装过程如下

代码语言:javascript
复制
wget http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gz
tar xzvf Linux-metal.tar.gz
cd generic-metal/

在安装目录,有一个名为metal的可执行文件,该程序用法很简单,只需要编写一个配置文件,然后执行即可,所以关键在于配置文件的编写。在软件的安装目录,有一个名为example的文件夹,提供了两个示例,其中的metal.txt就是配置文件。

meta-analysis是对多个gwas分析结果进行综合评价,该软件支持以下两种meta分析的算法

  1. pvalue
  2. standard error

第一种是基于p值;第二种是基于标准误,我们知道标准误指的是某个统计量的分布,在使用第二种算法时,需要提供对应的统计量,即Effect, 以逻辑回归/线性回归为例,Effect对应的就是回归系数BETA, 标准误对应的就是回归系数的SE。

每种算法要求的gwas分析结果的格式稍有不同,其中以下3列是必须有的

  1. SNP对应的id或者rs号
  2. test allele
  3. other allele

在关联分析的结果中,会有OR值来表征关联强弱,而OR值是一个比值,分子除以分母,分子对应的allele为test allele, 分母对应的allele为other allele。

基于pvalue的算法,额外要求以下3列

  1. Pvalue
  2. 表示test allele和疾病关联方向的列,有正相关和负相关两种,以OR值为例,大于1为危险因素,小于1为保护因素,当时,为了能够区分正负,OR值需要取log
  3. 可选的列,表示样本的大小,根据每个数据集的样本大小来进行加权

基于标准误的算法,额外要求以下2列

  1. effect
  2. standard error

前文已经给过解释,effect对应回归分析中的回归系数beta值,standard error对应回归系数的SE。

在配置文件中共,我们需要指定每个study的GWAS结果中上述列对应的标题,以及文件分隔符等选项,这样才能保证软件正确的识别所需的信息,一个配置文件的示例如下

配置好之后,只需执行以下命令即可进行分析

metal metal.config.txt

输出结果示意如下

通过输出结果中的pvalue,来筛选显著关联的位点,通过gwas meta-analysis, 可以达到增加样本量,提高检验效能的目的,而且有助于发现新的关联位点。

·end·

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档