前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >dbNSFP:非同义突变功能注释数据库

dbNSFP:非同义突变功能注释数据库

作者头像
生信修炼手册
发布2019-12-19 10:48:40
1.9K0
发布2019-12-19 10:48:40
举报
文章被收录于专栏:生信修炼手册

在对SNV位点进行注释时,往往需要综合采用多个数据库的注释结果,为了方便肿瘤研究人员,dbNSFP对人类基因组上的突变位点进行了丰富全面的功能注释,其目的是提供一站式服务,通过这一个数据库就可以完成突变位点的功能注释,文章链接如下

http://onlinelibrary.wiley.com/doi/10.1002/humu.22932/abstract

该数据库网址如下

https://sites.google.com/site/jpopgen/dbNSFP

最新版本为v4.0, 收录了来自外显子测序的84,013,490个SNV位点,包含以下3种类型

  1. non-synonymouse SNVs(nsSNVs),包含stop-gain, stop-loss和missense SNVs
  2. splicing-site SNVs(ssSNVs)
  3. splicing consensus regions SNVs(scSNVs), 指的是发生在剪切位点附近的SNV, 5’剪切位点上游3bp到下游8bp和3’剪切位点上游12bp到下游2bp范围内的SNV, 这些SNV来自于dbscSNV数据库

该数据库中采用了多种软件和算法对SNV的功能和保守性进行打分,用到的软件示意如下

为了对这些不同得分系统的效能有一个更加清晰的认识,基于模拟数据进一步分析了这些不同指标的预测效果,模拟数据集I的ROC曲线如下

可以看到VEST3的效果最佳,MetaSVM和MetaLR这两个打分系统的AUC也在0.9以上,模拟测试集II的ROC曲线如下

最好的两个为MetaLR和MetaSVM, 再进一步对这些打分系统进行聚类,结果示意如下

聚为一类的打分系统其作用较为接近,可以看到这些打分系统分为了4大类别,如果觉得指标太多无从下手,可以从功能相近的指标中挑出一个作为代表,可以大大减少筛选时的复杂度。

除了功能和保守性打分外,该数据库也提供了频率和基因注释,比如常见的1000G, ESP, Exac, gnomAD等频率数据库和HCNC, GO, kegg pathway等基因注释数据库中的信息。

官网只提供了下载功能,如果需要查看该数据库中的数据,可以通过以下网站

https://myvariant.info

如果想利用该数据库对自己的SNV进行注释,可以采用官方推荐的WGSA软件,官网如下

https://sites.google.com/site/jpopgen/wgsa

需要注意的是,该数据库需要访问外国网站才可以得到。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档