染色体结构变异structural variation(SV), 被定义为1kb以上范围的DNA结构变化,通常包括缺失,重复,倒位,易位,当然也包含拷贝数变异(CNV), 染色体的结构变异来源于内因或者外因的作用,很多疾病就是由于染色体结构变异导致的,环境因素也可以诱导产生结构变异。
CMT是一种神经系统疾病,影响大脑和脊髓外的外周神经系统,主要表现为腿部肌肉萎缩,行走困难,可能出现足弓变高,足部畸形等症状,科学研究发现,该疾病与17号染色体上一段结构变异相关,示意如下
两个同源染色体的不平等交叉产生了两种基因型,基因型A包含了PMP22基因的3个拷贝,而基因型B包含了PM22基因的单拷贝,基因型A的个体就会发生CMT, 基因型B的个体则易感压力性麻痹HNPP。
dbvar数据库收录了来自多个研究项目的结构变异结构,网址如下
https://www.ncbi.nlm.nih.gov/dbvar/
在该数据库中,数据分为以下3个层级
variant region与variant call的对应关系如下,一段染色体区域可以存在多个结构变异事件
通过Study Browser菜单,可以以study为单位查看相关的结构变异信息,示意如下
通过Genomes Browser菜单,可以在基因组浏览器中查看相关的结构变异信息,示意如下
该数据库是可以免费下载的,ftp地址如下
ftp://ftp.ncbi.nlm.nih.gov/pub/dbVar/data/Homo_sapiens/by_study
提供了VCF, CSV, TSV等多种格式,dbvar与来自EBI的DGVa是互作关系,共同提供了包含健康人类与患病人类的结构变异信息,而DGV数据库则只包含了健康人群的染色体结构变异信息。