dbSNFP数据库发展历程

目前是第三版,Published online 2016 Jan 5. doi: 10.1002/humu.22932 全部版本介绍如下:

  • dbNSFP v1.0 (Liu et al. 2011) was based on the human reference sequence version hg18 and the gene model of Consensus Coding Sequence (CCDS) version 20090327 (Pruitt et al. 2009). It included 75,931,005 nsSNVs and four functional prediction scores: SIFT (Ng and Henikoff 2001), Polyphen2 (Adzhubei et al. 2010), LRT (Chun and Fay 2009) and MutationTaster (Schwarz et al. 2010), and one conservation score: phyloP (Siepel et al. 2006) for each nsSNV.
  • dbNSFP v2.0 (Liu et al. 2013) was rebuilt based on the human reference sequence version hg19 and the gene model of GENCODE 9 (Harrow et al. 2012). It compiled 87,347,043 nsSNVs and 2,270,742 ssSNVs. 七种打分算法:(SIFT, 2× Polyphen2, LRT, MutationTaster, MutationAssessor and FATHMM), 两个人群频率: and allele frequencies from the 1000 Genomes Project phase 1 data (The 1000 Genomes Project Consortium 2012) and the NHLBI Exome Sequencing Project data (Fu et al. 2013).
  • 包含 82,832,027 nsSNVs and ssSNVs,基于 GENCODE 22 ,而且有 20种突变影响预测算法,(SIFT, Polyphen2-HDIV, Polyphen2-HVAR, LRT, MutationTaster2, MutationAssessor, FATHMM, MetaSVM, MetaLR, CADD, VEST3, PROVEAN, FATHMM-MKL coding, fitCons, DANN, GenoCanyon, Eigen coding, Eigen-PC, M-CAP, REVEL, MutPred), 6 conservation scores (PhyloP x 2, phastCons x 2, GERP++ and SiPhy) ,还包括一些公共人群数据库的allele frequencies。

数据在谷歌:https://sites.google.com/site/jpopgen/dbNSFP

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2018-04-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

资源 | 囊括欧亚非大陆多种语言的25个平行语料库数据集(拿走不谢!)

原文链接:https://gengo.ai/datasets/25-best-parallel-text-datasets-for-machine-transl...

1333
来自专栏CreateAMind

DeepMind可微分神经计算机-论文中文解读

又是一篇deepmind发表在nature上的文章,还记得前面2篇吗?一篇是DQN,一篇讲AlphaGo。发表在nature上的论文格式不太一样,正文只是简单描...

832
来自专栏量子位

谷歌跨界医学新动作:基因突变定位模型又更!新!了!

去年12月,谷歌大脑发布了快速找出基因突变位点的深度学习模型DeepVariant,用图像识别的思路来精准定位出基因序列中突变的位点。

651
来自专栏iOSDevLog

Scikit-Learn教程:棒球分析 (一)

一个scikit-learn教程,通过将数据建模到KMeans聚类模型和线性回归模型来预测MLB每赛季的胜利。

1682
来自专栏专知

【论文推荐】最新六篇聊天机器人相关论文—弱监督信息、内容驱动、对话管理系统、可扩展情感序列到序列、自主性

2082
来自专栏鹅厂优文

游戏人工智能 读书笔记 (四) AI算法简介——Ad-Hoc 行为编程

本书英文版: Artificial Intelligence and Games - A Springer Textbook

23310
来自专栏about云

使用Spark MLlib给豆瓣用户推荐电影

问题导读: 1.常用的推荐算法有哪些? 2.推荐系统是什么样的流程? 3.从这个推荐系统我们能学到什么? 推荐算法就是利用用户的一些行为,通过一些数学算法,推测...

6977
来自专栏SDNLAB

5G革命的技术,一个都不能少

第五代移动网络简称5G是产业界即将实现的移动技术革命,是LTE-A网络的深层演进技术。5G网络中的关键技术包括MIMO、OFDM、SC-FDMA等。 超密集微型...

42112
来自专栏生信技能树

比较不同单细胞转录组数据寻找features方法

挑选到的跟feature相关的基因集,有点类似于在某些组间差异表达的基因集,都需要后续功能注释。 背景介绍 单细胞转录组测序的确可以一次性对所有细胞都检测到上千...

64410

利用基因突变和K均值预测地区种群

这是一篇关于西北基因组中心的Deborah Siegel和华盛顿大学联合Databricks的Denny Lee,就ADAM和Spark基因组变异分析方面的合作...

25610

扫码关注云+社区