首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

研究遗传变异,可能你缺这样一个数据库!

在研究遗传变异的过程中,相信大家都会用到一些数据库来查找相关的基因,来了解更多的信息。那今天,我们就给大家介绍一个遗传资源数据库吧,希望能帮到大家~

Genome Aggregation Database:

简称gnomAD,是由各国研究者联合发展起来的基因组突变频率数据库。其目的是汇集和协调来自众多大规模测序计划的全外显子组和全基因组测序数据,为广泛的科学研究团体汇总数据。

该数据库提供的数据集包括123136个个体的全外显子组测序数据和15496个个体的全基因组测序数据,这些数据来源于各种疾病研究项目及大型人群测序项目。

首页如下

我们可以通过这个数据库直接搜索自己需要了解的基因。

那今天就以PCSK4为例,进行说明。

这是基因的一个简单介绍。

我们还可以看见基因上每个位点的覆盖信息图,其中全基因组数据的测序深度用绿线表示,外显子数据深度为蓝色部分。

变异注释表格记录了变异位点,来源,注释信息,变异flags,变异等位基因数,等位基因总数,等位基因频率等信息。我们也可以直接选择基因进入了解。

还有一点大家可以注意一下,这个数据库展示的等位基因数默认是只计数了高质量的基因型,即通过了设定的阈值(GQ>=20,DP>=10,杂合基因型allele balance >0.2)的,原始的等位基因数可通过AC_raw查看。

我们也可以对全外显子组,全基因组变异vcf文件及覆盖度的数据进行下载。

最后告诉大家喔,该数据库去除了携带有严重儿童疾病的患者及其父母的基因组数据,可以很好的应用于单基因遗传病人群频率的查询。对于评估罕见位点的致病性,如果某位点在该数据库未见报道,则致病几率增大。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180606B0L9BT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券