首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Haplotype Reference Consortium:最大规模的单倍型数据库

横坐标为study样本中不在reference panel中的SNP位点比例, 纵坐标为填充的准确率,可以看到HRC的填充准确率明显高于UK10K和1000G。...展示的是14号染色体上的曼哈顿图,rs28929474是阳性结果,从左侧到右侧,分别对应hapmap, 1000G和HRC。...使用HapMap填充,没有识别到该阳性位点,1000G和HRC都识别到了该阳性位点。...大部分为低深度全基因组测序的结果,共包含了32611个样本,遗憾的是,该数据库的信息并没有完全公开,目前只有通过两个在线网站,可以使用该数据库进行基因型填充,网址如下 https://imputation.sanger.ac.uk...对于基因型填充而言,构建更大规模单倍型数据库是提高准确率的有效方法,采用HRC数据库,可以有效提供填充准确率。

1.6K30
您找到你想要的搜索结果了吗?
是的
没有找到

生信分析零背景 变异注释你也行

虽然各实验室相继推出了如pubvar、mutlazer之类的查询网站,但由于维护频率不高,后台很多数据库未及时更新,导致注释的结果存在信息不全、版本过低等情况。...三 、部分注释选项说明 1、人群频率注释 1000G所有人种: ? 1000G不同人种: ? GnomAD: ?...2、参考文献注释: 报道该变异位点的文献PMID号,文献收集自ClinVar数据库2019年12月更新版和HGMD-public数据库2019年第4季度更新版(2020年10月30日测试结果) ?...4、功能注释(即用来判断ACMG证据PP3,BP4,BP7的信息) dbNSFP数据库注释: 共采用29种算法对错义突变进行致病性预测,详见文末网址(2) ?...(默认为Disabled,根据需要选择dbNSFP数据库中需要注释的内容) 剪切位点预测: ? 四 、结果查看和导出 ? ?

2.6K21

GWAS数据没有提供eaf,如何是好……

中找不到,占比",length(harna)/r*100,"%")) print(paste0("一共有",length(error),"个SNP在输入数据与1000G中效应列与参照列...1000G里面提供的数据完全不一致,比如这个SNP输入的效应列是C,参照列是G,但是1000G提供的是A-T,这种情况下,EAF会被清空(NA),当成匹配失败") return(dat...找不到,占比",length(harna)/r*100,"%")) print(paste0("一共有",length(error),"个SNP在输入数据与1000G中效应列与参照列,...将剔除eaf,占比",length(error)/r*100,"%")) print("输出数据中的type列说明:") print("raw:EAF直接等于1000G里的MAF...1000G里面提供的数据完全不一致,比如这个SNP输入的效应列是C,参照列是G,但是1000G提供的是A-T,这种情况下,EAF会被清空(NA),当成匹配失败") return(dat

8.5K23

通过案例带你轻松玩转JMeter连载(35)

price":149.00 }, { "category": "零食", "name": "百草味", "desc": "百草味 休闲零食小吃整箱蛋糕办公室早餐手撕面包点心传统糕点 原味肉松饼1000g...每日坚果炒货休闲网红囤货零食小吃下酒菜花生米"} var11_2={"name":"百草味","category":"零食","price":34.9,"desc":"百草味 休闲零食小吃整箱蛋糕办公室早餐手撕面包点心传统糕点 原味肉松饼1000g...每日坚果炒货休闲网红囤货零食小吃下酒菜花生米"} var12_2={"name":"百草味","category":"零食","price":34.9,"desc":"百草味 休闲零食小吃整箱蛋糕办公室早餐手撕面包点心传统糕点 原味肉松饼1000g...matchNr=5 var5_1={"name":"百草味","category":"零食","price":34.9,"desc":"百草味 休闲零食小吃整箱蛋糕办公室早餐手撕面包点心传统糕点 原味肉松饼1000g...food[3] var5_1={"name":"百草味","category":"零食","price":34.9,"desc":"百草味 休闲零食小吃整箱蛋糕办公室早餐手撕面包点心传统糕点 原味肉松饼1000g

36320

dbNSFP:非同义突变功能注释数据库

在对SNV位点进行注释时,往往需要综合采用多个数据库的注释结果,为了方便肿瘤研究人员,dbNSFP对人类基因组上的突变位点进行了丰富全面的功能注释,其目的是提供一站式服务,通过这一个数据库就可以完成突变位点的功能注释...该数据库中采用了多种软件和算法对SNV的功能和保守性进行打分,用到的软件示意如下 为了对这些不同得分系统的效能有一个更加清晰的认识,基于模拟数据进一步分析了这些不同指标的预测效果,模拟数据集...除了功能和保守性打分外,该数据库也提供了频率和基因注释,比如常见的1000G, ESP, Exac, gnomAD等频率数据库和HCNC, GO, kegg pathway等基因注释数据库中的信息。...官网只提供了下载功能,如果需要查看该数据库中的数据,可以通过以下网站 https://myvariant.info 如果想利用该数据库对自己的SNV进行注释,可以采用官方推荐的WGSA软件,官网如下...https://sites.google.com/site/jpopgen/wgsa 需要注意的是,该数据库需要访问外国网站才可以得到。

1.9K30

使用IMPUTE2进行基因型填充

static.tgz tar xzvf impute_v2.3.2_x86_64_static.tgz 除了软件外,还需要reference panel,官网也提供了对应的下载文件,包括hapmap和1000G...impute2官方推荐了一套基因型填充的最佳实践,步骤如下 对检测样本的原始分型结果质控,使用GWAS分析的质控条件即可 校正基因组版本,hapmap和1000G都是基于hg19版本,必须保证和reference...panel的基因组版本一致,才可以准确填充,如果不一致,可以使用UCSC的liftOver工具进行转换 校正链的方向, hapmap和1000G的结果都是基于参考基因组的正链表示的,为了和reference...panel进行匹配,必须将芯片的分型结果也统计校正到正链 选择reference panel,1000G比hapmap的snp位点数量更多,密度更大,是目前最常用的reference panel, 其中又分成了不同的人群

2.8K20

SEdb:超级增强子数据库简介

SEdb是一个综合性的超级增强子数据库,文章发表在Nucleic Acids Research上,链接如下 https://academic.oup.com/nar/article/47/D1/D235.../5146197 该数据库的网址如下 http://www.licpathway.net/sedb/ 采用了H3K27ac这种组蛋白修饰作为增强子区的标记,利用从ENCODE, RoadMap, GEO...等公共数据库中下载的H3K27ac chip_seq数据,首选采用MACS识别增强子区,然后采用ROSE这款软件来识别超级增强子区。...对于识别到的超级增强子区,利用bedtools进行下列注释 SNP位点 从dbSNP数据库下载SNP位点,利用1000G的数据对SNP位点进行连锁不平衡分析,同时从GWAS Catalog和GWASdb...,还通过6种不同策略对超级增强子的靶基因进行预测,所有的注释信息和靶基因预测结果都可以通过数据库检索进行查询和浏览。

2.6K40

3dsnp:SNP在染色质环介导的调控网络中的分布数据库

为了更好的研究SNP与基因调控的关系,科学家将染色质环介导的互作信息和SNP联系起来,通过公共数据库,挖掘并整理出了位于非编码区的SNP位点在空间互作中的分布。...相关结果整理成了一个数据库3dsnp,对应的文章发表在Nucleic Acids Research上,链接如下 https://academic.oup.com/nar/article/45/D1/D643.../2333918 数据库的网址如下 http://cbportal.org/3dsnp/ ?...从dbSNP数据库中得到human的SNP位点信息,然后通过1000G数据库中的频率进行LD分析,得到SNP位点间的连锁关系。...3dSNP数据库将SNP位点与染色质环介导的调控信息联系起来,提供了SNP研究的新视角,为研究SNP对基因调控的影响提供了新思路,非常值得参考和借鉴。

89621
领券