前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >孟德尔随机化中的无效工具变量检验

孟德尔随机化中的无效工具变量检验

作者头像
生信修炼手册
发布2020-05-07 15:59:44
2.6K0
发布2020-05-07 15:59:44
举报
文章被收录于专栏:生信修炼手册生信修炼手册

两样本的孟德尔随机化研究只需要基于gwas summary数据,就可以研究暴露因素和结局变量之间的因果关系,是最广泛使用的研究手段之一。要保证MR研究结果的可靠性,需要在分析的各个环节进行有效的质控。

孟德尔随机化研究中以遗传变异为工具变量,而合格的工具变量需要符合以下几个条件

  1. 与暴露因素的强关联,称之为关联性假设
  2. 与混杂因素相独立,称之为独立性假设
  3. 只会通过暴露因素对结局变量造成影响,称之为排他性假设

众所周知,基因具有多效性(pleiotropy effect), 当把具有多效性的基因纳入工具变量的集合时,会对MR的分析结果造成影响。当多效性的基因可以通过混杂因素影响结局变量时,违背了独立性假设;当多效性的基因可以通过代谢通路等其他途径来影响结局变量时,违背了排他性假设。无法满足以上3点的遗传变异,称之为无效的工具变量。

为了确保分析结果的准确性,需要对无效工具变量进行检验, 有多种检验方式,其核心思想是异质性检验, 假设每个工具变量的因果效应估计值是相似的,当存在无效工具变量时,其计算得到的因果效应估计值与有效的工具变量存在较大差异,总体上看就会存在显著的异质性。

在进行无效工具变量的显著性检验时,常用的方法为Cochran’s Q检验,这一检验异质性的方法在meta分析中广泛使用。Q检验适用于处理如下数据

subject表示样本,其他列表示不同的条件。Q检验要求条件的个数要大于等于2,而且每个样本的数值为分二类的数值。其空假设为所有条件下数值的分布相同,其统计量称之为Q, 计算公式如下

其中

N表示样本总数,k表示条件的个数,i表示行,j表示列,Y表示i行j列对应的值。当样本量很大时,Q统计量服从自由度为k-1的卡方分布,对应p值的计算公式如下

当pvalue小于0.05 ,认为异质性不显著。除了Q检验外,还有一种在Q统计量的基础上发展而来的I square统计量,计算公式如下

通常情况下,I square的值在0-0.25之间,认为是较低异质性;0.25-0.5之间,中等程度的异质性,0.5到0.75之间,真实存在异质性,0.75以上,异质性很大。

在MR分析中,为了确保分析结果的可靠性,有必要进行无效工具变量的检验。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档