2018年7月29日ClinVar数据库已经可以下载,游侠下载后采用annovar官方脚本对VCF进行了转换,具体如下:
相比较游侠之前版本,修复了不少bug。大家可以自己运行脚本,不过这中间也是有不少坑!初学者可以直接下载游侠制作好的版本就可以。
另外,游侠整理了OMIM数据库对应基因与疾病关系数据库,下载日期为2018.6,经过手动筛选与校正保留3648个基因与对应的疾病,这个数据库对于临床诊断非常有帮助,如果一个全外显子经过人群频率和突变类型筛选后剩下300个基因位点,那么通过OMIM数据库筛选将只剩下50-60个位点,这样遗传分析师就可以肉眼一一核对基因与患者表型,提高临床诊断率。该数据库除了提供疾病名称外还提供遗传模式,方便分析人员根据遗传模式进一步提高人群频率,比如AD模式,可将频率下调至万分之五。需要注意的是用table_annovar.pl注释时,OMIM数据库的operation要选择r参数。
另外,最近人工智能也应用于错义突变的危害性预测,illumina开发了PrimateAI算法,发表于nature genetics(PMID: 30038395),并对基因组中7000多万个错义突变进行了预测,游侠也整理为annovar格式供大家测试。最近,中南大学湘雅医院和温州医科大学的研究人员开发了ReVe算法发表于Nucleic Acids Research(PMID: 30060008),游侠也整理为annovar格式供大家测试。以上四种数据库下载地址为百度网盘:
https://pan.baidu.com/s/1C67CvXDgaURbDjuhjkQ4jw密码:16lr,解压密码为ShangHaiXunYin(注意大小写)。
领取专属 10元无门槛券
私享最新 技术干货