学习
实践
活动
专区
工具
TVP
写文章

迄今最大规模中国人基因大数据研究成果发布

4月27日,华大基因在顶级科学期刊Cell旗下的Sneak Peek服务器上公开预印了十万中国人基因大数据研究成果。该研究通过分析约十四万中国人的全基因组数据,揭示了包括31个省、36个少数民族在内的中国人群精细遗传结构,实现了多种表型的全基因组关联分析,并探索了中国人血浆病毒组特征。这是迄今为止最大规模的中国人基因大数据研究,其方法及成果对我国群体遗传学、基因组学、精准医学等领域的科学研究和产业发展有重要意义。

近年来基因测序技术发展迅速,美、英等多个发达国家和地区从国家层面进行设计并开展了大规模的人群基因组项目,成果丰硕。我国虽然是世界上的第一人口大国和第二大经济体,但迄今由中国科学家主导的中国人群基因组研究成果相对有限,远不能与我国的全球地位相匹配。

为此,华大基因研究团队对总计十四万余中国人低深度全基因组数据展开了群体水平的研究,开发了一系列适用于此类数据的分析方法,构建了包含约900万个多态性位点的中国人群基因频率数据库(CMDB),其中包括约20万个新发现的多态性位点。研究揭示了中国汉族与少数民族群体的遗传特点,并发现当今中国人群的遗传特征分布同时受到丝绸之路等历史因素与近代人口大规模迁徙的影响。研究还发现多个随着纬度的变化而在频率上呈现明显差异的基因,展现了饮食、气候等因素对中国人群的演化所起到的作用。

十万基因大数据揭示中国各省人群与欧洲人、南亚人遗传距离的变化和基因流方向。左起:各省总人群与欧洲人亲缘关系呈现西北最强向东南方向减弱趋势;各省汉族人群与欧洲人比较暗示古代河西走廊地域两个种族人群的近交; 各省总人群与南亚人比较呈现西南最强向东北方向减弱趋势; 各省汉族人群与南亚人的比较与总人群趋势类似。

随着纬度变化受到环境选择的多个基因位点。比如,在FADS2上掌控着脂肪代谢效率的rs72643559的C等位基因在蔬菜供应缺乏的省份中会明显富集,而免疫应答相关的CR1基因中受到选择的变异位点则是呈现南部富集的现象。

此外,课题组首次利用该类数据开展了一系列的全基因组关联分析(GWAS)。在对身高、体重等表型的研究中,研究人员揭示了数十个在中国人群中与之相关的新基因。课题组还进一步研究了数据中的病毒序列分布,揭示了我国人群血浆病毒组与欧洲人的差别。

该论文目前在Cell主刊审稿中, 为了让此项研究成果更早地惠及广大科研工作者,课题组在编辑的邀请下于Cell的预印服务器Sneak Peek上公开了全文。该研究严格保护参与者隐私以及数据的安全,所有研究样本、数据均按照相关政策法规,保存于深圳国家基因库。基于该项目的中国人群基因频率数据库(CMDB)也同步上线,可以通过深圳国家基因库数据库访问。

论文并列第一作者——华大基因黄树嘉博士表示:“经过一年多的攻关,我们研发了一系列的新方法和新工具,突破了原有的局限和挑战,实现了对低深度全基因组数据的全面研究。”

论文共同通讯作者、项目负责人金鑫博士表示:“该成果表明,此类数据可以用于群体遗传学、复杂疾病与表型等领域的高水平研究。本课题所产生的中国人群基因频率库,也将在遗传病诊断等领域得到广泛的应用。”

论文通讯作者、华大首席执行官、深圳华大生命科学研究院院长徐讯表示:“对于中国人基因大数据的深入研究与理解,将引领出生缺陷、癌症、感染等领域的研究和应用,为精准治疗与防控提供指导,造福广大民众。”

生物信息分析团队。左起:刘荣、林珑、刘斯洋博士(第一作者)、李子龙、黄树嘉博士(并列第一作者)。

更多详情

中国人基因频率数据库(CMDB)

https://db.cngb.org/cmdb/

论文链接:

https://www.mendeley.com/sneak-peek/cellpress/

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180428A1F3H400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券