前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Haplotype Reference Consortium:最大规模的单倍型数据库

Haplotype Reference Consortium:最大规模的单倍型数据库

作者头像
生信修炼手册
发布2019-12-19 11:34:51
1.7K0
发布2019-12-19 11:34:51
举报
文章被收录于专栏:生信修炼手册

在进行基因型填充时,reference panel的选择对填充结果的影响非常大,HapMap包含了3百多万个SNP位点,420个单倍型,1000G包含了8千多万个位点,5008个单倍型。除了这两个常用的reference panel外,还有很多大型的人类基因组测序项目,比如UK10K等等。reference panel包含的单倍型越多,填充的准确率越高,涵盖的SNP位点越多,填充后可以用于GWAS分析的位点就越多,可以更加有效的挖掘关联信号。

Haplotype Reference Consortium简称HRC, 整合了来自UK10K, 1000G等多个项目的结果,构建了一个包含3千多万个SNP位点,64976个单倍型的reference panel, 对应的文章发表在nature genetics上,链接如下

https://www.nature.com/articles/ng.3643

在文章中比较了不同reference panel对填充准确率的影响,结果如下

横坐标为study样本中不在reference panel中的SNP位点比例, 纵坐标为填充的准确率,可以看到HRC的填充准确率明显高于UK10K和1000G。另外,对于reference panel对于GWAS结果的影响也进行了比较,结果如下

展示的是14号染色体上的曼哈顿图,rs28929474是阳性结果,从左侧到右侧,分别对应hapmap, 1000G和HRC。使用HapMap填充,没有识别到该阳性位点,1000G和HRC都识别到了该阳性位点。

HRC官网链接如下

http://www.haplotype-reference-consortium.org/

包含的基因组测序项目如下

大部分为低深度全基因组测序的结果,共包含了32611个样本,遗憾的是,该数据库的信息并没有完全公开,目前只有通过两个在线网站,可以使用该数据库进行基因型填充,网址如下

https://imputation.sanger.ac.uk/ https://imputationserver.sph.umich.edu/

在EBI中,包含了该数据库的一个子集供下载,网址如下

https://www.ebi.ac.uk/ega/studies/EGAS00001001710

对于基因型填充而言,构建更大规模单倍型数据库是提高准确率的有效方法,采用HRC数据库,可以有效提供填充准确率。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档