学习
实践
活动
专区
工具
TVP
写文章

迄今最大规模的中国人基因大数据研究成果在Cell上预印

近年来基因测序技术发展迅速,全球多个发达国家和地区从国家层面设计并开展了大规模的人群基因组项目,并取得了一定的成果。2018年4月27日,华大在顶级科学期刊Cell旗下的Sneak Peek服务器上公开预印了十四万中国人基因大数据研究成果,是迄今为止最大规模的中国人基因大数据研究,其方法及成果对我国群体遗传学、基因组学、精准医学等领域的科学研究和产业发展有重要意义。

华大研究团队对总计十四余万中国人低深度全基因组数据展开了群体水平的研究,开发了一系列适用于此类数据的分析方法,揭示了包括31个省,36个少数民族在内的中国人群精细遗传结构,实现了多种表型的全基因组关联分析,构建了包含约900万个多态性位点的中国人群基因频率数据库 (CMDB),其中包括约20万个新发现的多态性位点,揭示了中国汉族与少数民族群体的遗传特点,并发现当今中国人群的遗传特征分布同时受到丝绸之路等历史因素与近代人口大规模迁徙的影响。研究还发现了多个随着纬度的变化而在频率上呈现明显差异的基因,展现了饮食、 气候等因素对中国人群的演化所起到的作用。

十四万基因大数据揭示中国各省人群与欧洲人、南亚人遗传距离的变化和基因流方向。

左起: 各省总人群与欧洲人亲缘关系呈现西北最强向东南方向减弱趋势; 各省汉族人群与欧洲人比较暗示古代河西走廊地域两个种族人群的近交; 各省总人群与南亚人比较呈现西南最强向东北方向减弱趋势; 各省汉族人群与南亚人的比较与总人群趋势类似。

随着纬度变化受到环境选择的多个基因位点。

此外,课题组首次利用该类数据开展了一系列的全基因组关联分析 (GWAS)。在对身高、体重等表型的研究中,揭示了数十个在中国人群中与之相关的新基因。课题组还进一步研究了数据中的病毒序列分布,揭示了我国人群血浆病毒组与欧洲人的差别。

该论文目前在Cell主刊审稿中, 为了让此项研究成果更早的惠及广大科研工作者,课题组在编辑的邀请下于Cell的预印服务器Sneak Peek上公开了全文。该研究严格保护参与者隐私以及数据的安全,所有研究样本、数据均按照相关政策法规,保存于深圳国家基因库。基于该项目的中国人群基因频率数据库 (CMDB) 也同步上线,可以通过深圳国家基因库数据库访问。

黄树嘉 博士

论文并列第一作者

“经过一年多的攻关,我们研发了一系列的新方法和新工具,突破了原有的局限和挑战,实现了对低深度全基因组数据的全面研究。”

金鑫 博士

论文共同通讯作者,项目负责人

“该成果表明,此类数据可以用于群体遗传学、复杂疾病与表型等领域的高水平研究。本课题所产生的中国人群基因频率库,也将在遗传病诊断等领域得到广泛的应用。”

徐讯 博士

论文通讯作者,华大基因集团CEO,

华大生命科学研究院院长

“对于中国人基因大数据的深入研究与理解,将引领出生缺陷、癌症、感染等领域的研究和应用,为精准治疗与防控提供指导,造福广大民众。”

课题组生物信息分析团队合影

从左到右依次为:刘荣,林珑,刘斯洋 (第一作者),

李子龙,黄树嘉 (并列第一作者)

中国人基因频率数据库 (CMDB) 网站链接:

https://db.cngb.org/cmdb/

论文链接:

https://www.mendeley.com/sneak-peek/cellpress/

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180501B0DIV200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券