在前天的内容中,我和大家介绍了评估弱工具变量偏倚的常用指标------F统计量,具体计算如下:
一般我们需要F统计量至少大于10才能有效避免弱工具变量带来的偏倚,当然F统计量大于100是最好的。我曾说过R2表示IV解释暴露的程度,它有时候很难直接获取,今天我想和大家补充介绍一下它的具体计算方法:
这里的MAF就是次要等位基因频率(minor allele frequency),β就是SNP对暴露的效应量(effect size),SD是标准差(standard deviation)。这里MAF和β都可以直接获取,在计算R2时它可以和效应等位基因频率(effect allele frequency,EAF)等价。不过,SD不是可以直接获取的,它需要进过如下转换:
这里SE就是β的标准误,可以直接获取,而N和F统计量计算公式中的N一致,表示的是暴露的GWAS样本量。
这一期内容其实就是对上一期的补充,希望大家能熟练掌握F统计量的计算方法并能正确应用于孟德尔随机化的研究中!第二个公式中β/sd应该是平方!