Genome Aggregation Database(简称GNOMAD)是由各国研究者联合发展起来的基因组突变频率数据库。其目的是汇集和协调来自众多大规模测序计划的全外显子组和全基因组测序数据,为广泛的科学研究团体汇总数据。
Exomiser的结果主要有四个部分组成,每个部分都对应一个模块:
(1)AnalysisSettings:运行软件时设置的参数
(2)FillteringSummary:过滤结果的汇总
(3)Variant Type Distribution :变异类型的分布
(4)PrioritisedGenes:变异相关基因的打分排序
AnalysisSettings部分:此部分主要是对分析的参数设置进行汇总,大部分为默认设置参数,比较常用的参数为vcf,genomeAssemble,hpoIds等参数
每一个参数类型以冒号分割,冒号之前为参数名,冒号之后为参数
vcf:为GATK, Varscan等基因组分析软件得到的变异位点文件
genomeAssembly:为基因组的版本,这里选用HG19版本这个要与VCF文件所对应的参考基因组版本一致。
hpoIds:为该病人对应的表型,HPO ID信息,可以通过HPO数据库进行查找,更具病人表型信息查找其HPO ID。
Filtering Summary部分:
该部分主要是对变异位点过滤的统计
Variant effect:通过变异的影响过滤,主要是注释到不同数据库来查看该变异位点对编码区,非编码区,5‘UTR等基因区域的影响来进行过滤筛选
Frequency:通过等位基因频率来进行过滤筛选
Pathogenicity:通过致病性来进行过滤筛选
Inheritance:通过遗传类型进行过滤筛选
Variant Type Distribution部分:
对变异类型进行统计,FRAMESHIFT_ELONGATION移码突变导致ORF框拉长,FRAMESHIFT_TRUNCATION移码突变导致开放阅读框截断,错义突变,同意突变等不同突变类型的统计
Prioritised Genes部分:
该部分为结果最为重要的部分,主要是根据表型,致病性,及突变位点等信息对基因进行排序,确定比较可能导致该疾病的基因
1Exomiser Score:为Exomiser软件给出的得分,得分越高说明这个基因越可能致病
2PhenotypeScore:表型匹配得分,改疾病和这个基因表型的相似性
3Variant Score:突变得分
Genome Aggregation Database(简称gnomAD)是由各国研究者联合发展起来的基因组突变频率数据库。其目的是汇集和协调来自众多大规模测序计划的全外显子组和全基因组测序数据,为广泛的科学研究团体汇总数据。
领取专属 10元无门槛券
私享最新 技术干货