今天开始我们就正式进入文献复现啦,一篇文献计划分三次完成,分别是:
A drug target for erectile dysfunction to help improve fertility, sexual activity, and wellbeing: mendelian randomisation study https://pubmed.ncbi.nlm.nih.gov/38086555/
简而言之,这篇文章是分四步来完成的。如果忽略A、D的话,看起来B、C是常规的MR分析,都是在找暴露与结局的因果关联。
那么重点就变成了A和D⬅这也是药靶MR的核心环节。
首先,需要明确PDE5所在染色体的位置:
(GRCh37/ hg19 chromosome 4 position 120 415 550 - 120 550 146)
这个信息从哪里获取呢?
PDE5A Gene - GeneCards | PDE5A Protein | PDE5A Antibody
可以看到是有两个来源的,选择 [Ensembl](https://grch37.ensembl.org/Homo_sapiens/Gene/Summary?g=ENSG00000138735)
在药靶MR中,我们可以先确定药物的靶基因所在染色体的位置,再根据这个药物对应的疾病表型找到疾病的GWAS数据,将这段染色体对应到疾病的SNP上,这样一来,就获得了所谓的
Genetic instruments for proxy drug targets
,当然,这是一般的套路。
在这篇文章里,作者选取2018 eQTLGen Consortium中的数据(P<5×10−8)。接下来,为确保 MR中用作工具的变异之间没有高度相关性,我们按照它们与舒张压相关性的 P 值进行了排序,并对相关性 r2<0.35 且距离阈值为 10 000 kb碱基的连锁不平衡变异进行了clump,获得最后用作MR分析的工具变量:
为什么选择舒张压呢?
我们之所以选择舒张压而非收缩压作为主要分析对象,是因为 PDE5 抑制和由此导致的环磷酸鸟苷活性增加会诱导血管平滑肌松弛和血管扩张,从生理学角度看,这对舒张压的影响要大于收缩压。
现在有一些文章选择降压药物作为药靶分析,你注意到他们选择的是收缩压还是舒张压了吗?
临床上PDE5作为肺动脉高压和勃起障碍的治疗药物,所以为了证明所选择SNP的可靠性,作者用这部分SNP和这两个结局做了常规的MR分析。这就是B~
B的目的是增加每种遗传关联的可用样本量,从而提高可用的统计能力。 This two sample mendelian randomisation paradigm increases the available sample size for each of the genetic associations, thus increasing available statistical power.
C和B的方法是一样的,暂且按下不表。
这部分的敏感性分析,作者使用收缩压重复MR分析,以权衡模仿 PDE5 抑制作用的遗传变异的影响。
同时,为了探究与使用弱工具有关的潜在偏差,我们在排除与舒张压关系最弱的变异后重复了主要的MR分析,以评估结果是否发生了实质性变化。
这里对共定位的目的又有了更深的认识。建议大家好好看看这一段~
当与表型相关的变异体与与结果相关的变异存在连锁不平衡时,就会产生虚假的MR关联。为了探讨我们的研究结果对连锁不平衡混杂的稳健性,我们使用 Coloc 统计方法在舒张压和所有结果之间进行了贝叶斯共定位,在这些结果中发现具有统计学意义的MR关联。
第五个假设的高后验概率(>0.8)支持两个性状的基础存在一个共享的因果变异;而第四个假设的高后验概率(>0.8)支持每个性状的基础存在不同的因果变异,表明在相应的MR关联中存在连锁不平衡的混杂(也称为水平多效性)。
如果存在统计学意义上显著的MR关联,而且不是假阳性发现,那么如果第四和第五假设的后验概率都小于 0.8,这将表明共定位分析的能力可能不足,无法区分MR关联是归因于共享的因果变异,还是归因于连锁不平衡的混杂变异(即水平多效性)。
文章还涉及了对GWAS数据的meta分析:
舒张压全基因组关联研究对参与国际血压联合会和英国生物库的 77 个队列的数据进行了荟萃分析,这些队列由 757 601 名欧洲男女参与者组成。
目前为止还没有进行过这个操作,看来又有新东西可以学了!(有没有会的朋友呀~)
除此之外,不难发现,文章其实没有涉及太复杂的方法,但是每一步之间都有很好的衔接,更重要是idea也非常吸引人!