【直播】我的基因组64:用gwas来预测健康风险

既然我的基因组已经确定无误了,那么我可以放心的探索啦!正好这几个月收集了朋友圈的一些GWAS新闻,就是某个科研团体研究了几千甚至上万人的基因型,找到了某几个位点跟某种性状或者疾病非常相关

【直播】我的基因组63:wegene芯片跟二代测序的简单比较

全基因组关联研究(genome–wide association study,GWAS)是指在全基因组层面上,利用现代基因芯片技术,通过对大样本人群DNA进行高密度遗传标记的分型检测,从而寻找多基因复杂病如糖尿病、肥胖病等的遗传因素的一种研究方法,能够发现与疾病发生、发展相关的基因变异位点!

收集的这些文献,目前大多数基因检测公司的预测健康风险理论依据,当然,作为一个成熟的商业公司,肯定不能仅仅只是参考文献,根据里面提到什么位点的基因型,就简单的给一个结论,里面肯定有相对比较复杂的建模过程,整个预测流程也是比较有技术含量的。

那,我们先看看公司是如何预测健康风险,比如我做的这个wegene的商业基因检测,得到的报告如下:

我随便打开一个健康风险预测结果如下:

那么这个风险值是如何计算的呢?很明显wegene也给出了该性状涉及到的位点,以及参考文献。

可以看到足足有28个位点,那么我简单的查阅了一下文献,如下:

早在2010年,通过GWAS已经定位约50个1型糖尿病易感位点,40余个2型糖尿病易感位点通过GWAS!(参考文献: http://zhtnbzz.yiigle.com/m/CN115791201201/636228.htm

但并不是说,科研界得到了这么多位点,公司就都一定要用上去,因为公司也需要评估这些位点是否可靠,而且芯片检测只有60万个位点左右,不一定会包含所有的风险相关位点。

那么,如果我没有在wegene公司做基因检测,没有拿到他们的报告,我应该如何来根据我自己的全基因组测序数据的结果来预测健康风险呢?

这个很难回答,我有足够的技术,但是却没有足够的时间,你们看上面wegene的报告,可以看到,里面涉及到了大大小小的分析结果超过200项,仅仅是健康风险就有86个,我能做的就是把我的300万个SNP注释到GWAS数据库,但是GWAS数据库实在是太大了,前面我们就说过注释结果里面各种奇葩结果。

【直播】我的基因组 38:我得了艾滋病?我是暴躁狂?

即使简单的注释,也还需要仔细的查看文献,根据GWAS结果,建立模型来进行风险预测,这都需要耗费很长时间,更重要的是,GWAS数据库里面涉及的性状太多太多了,远不止wegene公司提供的这200个,这样的海量信息,根本很难消化,也不会对我的生活起到积极的指导作用。哪怕是wegene精选的200项分析结果,其实我也并没有看全。

那么接下来就秀一下GWAS结果吧,如果你有了自己的基因型数据,很容易就可以查找一下,自己属于哪种情况。

分析方法,就是在位点注释的结果里面简单的文本查找,也就是ctrl+F,查找那些rs开头的ID号即可。

【直播】我的基因组 37:gwas研究结果在我身上得到了验证

多巴胺D2受体基因 rs1076560 G > T 与记忆能力强弱

多巴胺D2受体基因或DRD2,在rs1076560位点处,野生型是C(胞嘧啶),突变是T (胸腺嘧啶)表示。研究者招收了500名男性和女性进行了一项调查。每个参与者被要求估计他们忘带钥匙、忘记某人的名字、忘记去到某地的方向和其他日常细节等短期记忆缺失出现的频率。研究人员然后比较来自唾液中DNA样本的数据。

研究小组发现,**基因以表达为C型的人与基因表达为T型者相比,其健忘的平均水平明显更高**。“这种联系是显而易见的;这样的健忘可以部分归因于这个基因变体,”主要作者塞巴斯蒂安·马尔凯特博士解释道:“这个结果与其他研究的结果都很吻合。

COMT基因上的位点rs4680

COMT基因上的位点rs4680,德国波恩大学的科学家们发现它还与利他性(altruism、利他行动、利他主义)相关哦~他们做的实验是酱紫滴:首先,让101名自校学生参与一个记忆测试实验,作为酬金给他们每人5欧元。然后,给他们机会通过赌注使这5欧元增多。最后,给他们看过发展中国家的贫穷女孩的照片后把他们独自留在房间里,让他们选择是把得到的钱全带走还是捐出一部分或全部。研究结果显示,在rs4680位点上拥有G型的人比拥有A型的人捐出了更高比例的钱,也就是更具有利他性。

两个SNP和高度近视有关联

2013年Khor CC发表在Hum Mol Genet 上的GWAS研究对来自亚洲人群高度近视的**4篇GWAS进行的meta分析**,包含了中国四川和香港、日本以及新加坡人群,共计1603个高度近视和3427个健康对照。发现了**ZFHX1B基因的rs13382811和SNTB1基因的rs6469937这两个SNP**和高度近视有关联。

随后,作者又将这两个SNP在另外独立样本(亚洲人群1241高度近视和3559健康对照)中进行验证。

6个新的中国人群中的麻风病显著关联位点

研究人员对中国人群中的麻风病患者展开了3个阶段的GWAS研究。基于全基因组范围的探索阶段(stage1)中包含2套独立的数据:之前已报道过的GWAS研究中706位麻风患者、1225位对照个体和4362位免疫相关疾病的患者;新的未研究过的842位麻风患者和925位对照个体。Meta-分析2套数据集共有的4577171个SNPs

在全基因组范围内发现了6个新的显著关联位点(p<5×10-8),位点信息如下: rs2221593,rs73058713,rs10817758,rs58600253,rs663743,rs77061563。

9个基因组区域影响女性患子宫内膜癌患风险

研究了超过7000名子宫内膜癌患者和37000名没有患癌的女性的DNA,以确定影响女性患该疾病风险的基因变异。相关结果发表在2016年5月2日的《Nature Genetics》杂志上。在这项研究之前,我们只知道4个基因组区域,其中1个常见的基因变异会增加女性的子宫内膜癌的风险。在这项研究中,我们发现了另外5个基因组区域,总数达到了9个。

74个遗传变异跟教育程度相关

2013年他们研究了**10万人**,发现了3个与教育程度相关的遗传变异,后来又由253名科学家组成的一个国际研究小组,通过分析**30万例人群**样本信息并进行全基因组关联研究,鉴别出了与个体受教育程度有关的74个遗传变异,研究结果发布在5月11日的《自然》(Nature)杂志上。

其他相关位点

对11799个中国慢性HBV携带者中进行了多阶段的GWAS研究,研究者在2689位HBV携带者(包括1212位HCC病例和1477-非HCC对照)对733,202 SNPs位点进行基因分型。经过质量控制及过滤,在1161位HCC和1353位非HCC 中针对568280个位点进行进一步分析。结果找到2个SNPs,位于2q32.2-2q32.3的rs7574865和位于6q21.3的rs9275319。以往基于候选基因的研究策略,研究人员已陆续发现了若干个与 HBV 感染慢性化显著相关的单核苷酸多态性(Single nucleotidepolymorphism, SNP),这些 SNP 位于 ESR1、CD24、TNF-α 等基因上。随着全基因组关联研究(Genome-wide association study, GWAS)的兴起,研究人员基于该策略在亚洲人群中陆续发现了数个新的与 HBV 感染慢性化相关的遗传易感基因区域,包括 HLA-DP(rs3077 和 rs9277535)、HLA-DQ(rs2856-718 和 rs7453920) 、 HLA-C(rs3130542) 、 EHMT2(rs652888)、TCF19(rs1419881)、CFB(rs12614)、UBE2-L3(rs4821116)和 CD40(rs1883832)。

8p21.3 区域的 rs7000921 与 HBV 感染慢性化显著相关!

参考文献:

Cheng TH, Thompson DJ,, Tomlinson I, Spurdle AB. Five endometrial cancer risk loci identified through genome-wide association analysis. Nat Genet. 2016 May 2. doi: 10.1038/ng.3562.

Gelao B, Fazio L, Selvaggi P, et al. DRD2 genotype predicts prefrontal activity during working memory after stimulation of D2 receptors with bromocriptine[J]. Psychopharmacology, 2014, 231(11): 2361-2370.

KhorCC. et al. Genome-wide association study identifies ZFHX1B as a susceptibilitylocus for severe myopia. Hum Mol Genet, 2013, 22(25):5288-94.

http://www.guancha.cn/Science/2013_11_06_183702.shtml

全基因组关联研究发现8p21.3区域的INTS10基因是一种新的抑制HBV感染的抗性基因.pdf

文:Jimmy

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-03-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

用生命做研究:埃博拉是怎样传开的?

1425
来自专栏镁客网

黑科技 | 为解决汞污染问题,哈佛科学家巧用微生物自生长能力

880
来自专栏企鹅号快讯

Nature:科学家发现能有效编程癌症免疫疗法的关键开关蛋白!

原标题:Nature:科学家发现能有效编程癌症免疫疗法的关键开关蛋白! 本文系生物谷原创编译,欢迎分享,转载须授权! 在机体感染或肿瘤生长期间,一类名为CD8+...

3279
来自专栏人工智能快报

谷歌新人工智能工具可准确构建基因组图像

2017年12月,谷歌发布了一款新的人工智能工具,可利用基因测序数据准确地构建人类的基因组图像。 虽然科学家在约十五年前就已经首次完成人类基因组的测序工作,但在...

3489
来自专栏生信技能树

【直播我的基因组66:大多数性状往往是多个基因控制的

前面我们说到了那些简单的由单个基因决定的性状,这东西不需要预测,其中的生物学机制已经研究的非常透彻,只要拿到你的基因信息,很容易推断你的性状,比如人的乙醇脱氢酶...

3368
来自专栏生信宝典

ICGC数据库使用

TCGA是不错的癌症研究数据资源,但癌症研究不只是有TCGA。ICGC国际癌症基因组联盟,有亚洲、澳大利亚、欧洲、北美和南美17个行政区的89个项目,包括25,...

3399
来自专栏新智元

【Nature重磅】中国造世界首台光量子计算机,两项重大突破超越经典计算机

【新智元导读】 5月3日,科技界迎来了一则重磅消息:世界上第一台超越早期经典计算机的光量子计算机诞生。这个“世界首台”是货真价实的“中国造”,属中国科学技术大学...

3257
来自专栏大数据文摘

尚未出生,基因已见

1447
来自专栏Java学习网

10EB量级的基因大数据处理技术

10EB量级的基因大数据处理技术 很荣幸在这里跟大家分享大家以前很少接触到的领域的大数据情况。其实生命科学的大数据还处在比较初始的阶段,否则国家也不会现在才开...

2625

基因组测序简介

在Databricks中查看这篇文章的笔记形式

2025

扫码关注云+社区