首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【小工具】Clinvar

导读

ClinVar是NCBI主办的与疾病相关的人类基因组变异数据库。目前世界上大量研究机构、商业公司等的相关数据分析流程都以ClinVar数据库作为基因突变注释的重要参考工具。

它完整地整合了dbSNP、dbVar、Pubmed、OMIM等多个数据库在遗传变异和临床表型方面的数据信息,形成一个标准的、可信的遗传变异-临床表型相关的数据库。

当前数据库可支持XML、VCF以及制表符定界文件格式的文件。ClinVar同时支持在线和下载到本地两种形式。

在线网址:

https://www.ncbi.nlm.nih.gov/clinvar/

ClinVar支持简单搜索和高级搜索:

①简单搜索包括:

gene symbols

HGVS expressions

protein changes

rs numbers

diseases

submitters

a location on a chromosome for an assembly

下面以杜氏肌营养不良相关基因DMD为例,把关键词DMD输入在搜索框中,点击搜索。

从结果中,我们可以获知这个基因多种信息,其中有:

Ø总体信息:在左侧栏目找到这个关键词的总体统计信息,这些信息也可以作为筛选条件而使用。

Ø变异和位置信息:可以发现基因的变异位置、变异类型(A>C或是其他)、所在染色体信息等。

Ø与其相关的疾病。

Ø临床意义:可以简单理解为这个突变对临床疾病的重要性。分为pathogenic(致病),likely benign(可能良性)等多个等级。

Ø审核状态:因为这些临床意义是提交者自己定义并且提交的,因此有可能会对数据有一定误导作用,通过对数据的审核,有助于加强数据的可靠性。但不是每个数据都会有审核。

②高级搜索(点击Advanced)可通过类别(Fields)和关系符操作(AND/OR/NOT),比如:

以GBJ2为例,现在只想要看致病的位点,就可以点击Pathogenic(100)和Multiple submitters(48)进行筛选:

点击第一条记录:

ClinVar采用的是星标系统(star-based system),可以评估某个特定突变在疾病中的本来或者注释作用。四星级是最高级,也就是说这个突变的功能已经经过了多位专家的测评。三颗星表示通过专家评审;两颗星指有多个数据提交者都提供了解读标准,并且解读之间是一致的;更多时候是只有一星的突变,这通常只基于单个提出注释功能的研究成果,还有没有星的,也就是提交者没有提供解释标准和支持证据。

本地下载:

ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/

当我们已经拥有大量的变异数据信息,并且想对这些数据进行疾病研究,那么,我们可以考虑采用下载数据库到本地的方式。该数据库大约每月更新一次。值得注意的是,不同的基因型表现出的疾病关系很可能不同,所以在下载的vcf文件中,vcf文件条目和实际的ClinVar记录条目是一对多的关系。

获得数据库后,可以通过ANNOVAR等软件进行整合分析。把测序数据中的SNP等变异数据在ClinVar数据库中搜索并进行变异分析,可以寻找出对应的基因变异信息,发生频率,表型,临床意义,评审状态以及染色体位置等。

截止到2016年1月4日,ClinVar共收录了172,870个变异型,其中有56,742个至少满足一星标准,约105,000没有一星,建议谨慎对待。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190209G08CDV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券