首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

干货分享︱EWAS数据分析—mQTL 篇

通过前面4篇干货介绍,我们把EWAS常规分析的过程讲完了。理论上来说,如果结果比较理想,后期也能在大样本中验证出来,是可以发表研究成果了。但是,要是有其他更加深入的数据挖掘,那就是如虎添翼。其他数据是什么呢?

1

mQTL分析

如果我们手上同时提供样本基因型(Genotype)数据。那么,结合甲基化,我们就可以进行mQTL分析了。

什么是mQTL呢?对于连续型样本性状(Quantitative trait),GWAS通过回归分析,寻找与该性状呈显著关联的SNP位点。这些SNP位点称为“数量性状位点”(Quantitative trait loci;QTL)。当上述连续性状就是甲基化水平(Beta值)时,所得显著关联位点就称为mQTL(Methylation quantitative trait loci)。

mQTL以分析cis-mQTL为主,即利用某基因附近CpG位点甲基化水平Beta值作为因变量,筛选该基因处上下游W Mbase的染色体区域内的所有SNP变异作为自变量,逐一对该范围内的各个SNP位点S与甲基化水平M进行回归分析,从而得到与某基因甲基化水平显著相关的SNP位点:

表1 mQTL分析:与某基因甲基化水平显著相关的SNP位点

注:

gene ID表示表达水平量对应的基因编号;

SNP number表示该基因上下游区间内的SNP位点数量;

SNP ID表示当前检验的SNP编号;

distance表示当前SNP到基因位置的距离;

P value表示回归分析得出的、未经校正的p值;

Perm1表示经过校正的p值结果;

Perm2表示通过引入beta分布的置换检验进行校正后的p值结果,fastQTL推荐使用该列进行显著eQTL筛选。

2

Finemap精细定位分析

通过mQTL初步分析找到的SNP位点往往范围很大,其中很多变异信息仅仅具有统计意义上的关联性,而不是具有因果性。因此产生的候选基因也比较庞杂,包含很多和疾病没有关系的基因。

通过Finemap精细定位分析,进一步缩小易感位点,排除掉仅有关联性,而没有因果性的序列变异。

图1 单体型分析示例图

图2 精细定位示例图

3

共定位分析

mQTL是一种把甲基化数据和SNP数据结合起来共同去解释生物学问题的好方法。当然,将SNP和甲基化结合起来不止这一种方法,还有什么呢?那就是共定位分析。

在mQTL分析的基础上,结合GWAS的分析结果,可以进行共定位位点分析。

大部分GWAS显著关联位点都落在基因组非编码区。一种可能的解释是,这些易感位点通过调节特定区域的甲基化水平,从而改变个体复杂性状。如果某个位点既对复杂性状有影响,又对甲基化水平有影响,那么该位点就很有可能符合上述解释。共定位分析(Collocalization)正是试图找出这些“共定位”位点。

SMR利用GWAS的summary数据和表达数量性状基因座(eQTL)的数据,采用SMR和HEIDI方法,以测试基因表达水平与感兴趣的复杂性状之间的多效性关联。

图3 共定位分析示例图

通过以上的mQTL分析或者共定位分析,我们就能找到一些某基因甲基化水平显著相关的SNP位点。这样,以甲基化为中间桥梁,实现了SNP——甲基化——性状的生物学模型。值得注意的是,这三者到底是谁因谁果,这里是解释不了的,请耐心等待后续分解。

中科普瑞,旗下拥有上海鲸舟医学检验实验室有限公司和上海鲸舟基因科技有限公司,立足新一代测序及其衍生技术,以医学生物信息学为核心,提供覆盖肿瘤等重大疾病风险评估,早期筛查,分子病理诊断,肿瘤精准用药指导和预后预测等符合临床需求的解决方案,为精准医疗打造全方位服务平台。公司的中长期发展策略为医学大数据挖掘和人工智能的临床应用。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181012A1DLGA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券