【直播】我的基因组 32:使用annovar注释vcf

ANNOVAR软件用法看我以前的博客: 1.Annovar使用记录 (http://www.bio-info-trainee.com/641.html) 2.用annovar对snp进行注释 (http://www.bio-info-trainee.com/441.html) 3.对感兴趣的基因call variation(http://www.bio-info-trainee.com/2013.html)4.WES(六)用annovar注释(http://www.bio-info-trainee.com/1158.html)

ANNOVAR是一个perl编写的命令行工具,能在安装了perl解释器的多种操作系统上执行。允许多种输入文件格式,包括最常被使用的VCF格式。输出文件也有多种格式,包括注释过的VCF文件、用tab或者逗号分隔的txt文件。ANNOVAR能快速注释遗传变异并预测其功能。类似的variants注释软件还有VEP,snpEff,VAAST,AnnTools等等。

这是annovar的第一讲,照例我们先简单试用一下它的基础功能,因为这样的遗传变异位点的注释软件,功能实在是太多了,但是它最基础的东西是根据变异位点的坐标已经现有研究已知基因结构坐标的信息来将变异进行分类,类别如下:

其中位于外显子上面的突变是尤为重要的,所以会重点分析:

两个步骤即可:

~/biosoft/ANNOVAR/annovar/convert2annovar.pl -format vcf4old realign.vcf >realign.annovar ~/biosoft/ANNOVAR/annovar/annotate_variation.pl -buildver hg19 --geneanno --outfile realign.anno realign.annovar ~/biosoft/ANNOVAR/annovar/humandb/

annovar默认的注释方式是:

Done with 50914 transcripts (including 11516 without coding sequence annotation) for 26271 unique genes

这个是最基础的注释,几分钟就完成了480万个位点的注释。

其中有31741个variation位点在外显子上面,是指的我们重点关注的,其中外显子的variation又可以分成下面几种情况:

一般公司会把上面的数据画成一个好看的饼图,但这不是我们的重点,分析自己的基因组数据是为了探究本质的东西,而不是浮于表面。

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2016-12-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏张善友的专栏

PostgreSQL 与 MySQL 相比,优势何在?

一、 PostgreSQL 的稳定性极强, Innodb 等引擎在崩溃、断电之类的灾难场景下抗打击能力有了长足进步,然而很多 MySQL 用户都遇到过Serve...

2276
来自专栏安富莱嵌入式技术分享

【安富莱二代示波器教程】第3章 示波器设计—功能划分和准备工作

完整教程下载地址:http://forum.armfly.com/forum.php?mod=viewthread&tid=45785

462
来自专栏owent

ECDH椭圆双曲线(比DH快10倍的密钥交换)算法简介和封装

前面有几篇blog就提到我有计划支持使用ECDH密钥交换。近期也是抽空把以前的DH密钥交换跨平台适配从atgateway抽离出来,而后接入了ECDH流程。

843
来自专栏大数据和云计算技术

Flink Introduction

Hadoop开源社区新技术层出不穷,大家可能对Map/Reduce(YARN)/Spark很熟悉,最近又新增了一个Flink,也是大有来头。 Apache Fl...

2859
来自专栏云计算

利用IBM云功能构建无服务器应用程序

在 IBM(国际商业机器公司) 的 Serverlessconf 网站上,官方发布了 IBM Cloud Functions 的一项新功能(作为 IBM Res...

2217
来自专栏开发与安全

中断机制和中断描述符表、中断和异常的处理

注:本分类下文章大多整理自《深入分析linux内核源代码》一书,另有参考其他一些资料如《linux内核完全剖析》、《linux c 编程一站式学习》等,只是为了...

1840
来自专栏Hadoop数据仓库

HAWQ取代传统数仓实践(四)——定期ETL(Sqoop、HAWQ)

一、变化数据捕获(CDC)         初始装载只在数据仓库开始使用前执行一次,然而,必须要周期性地执行装载源数据过程。与初始装载不同,定期装载一般都是增量...

43410
来自专栏杨建荣的学习笔记

MySQL备份调度器的实现

对于MySQL方向的调度需求考虑了好久,总是感觉不够优雅,不够灵活。从我的感觉来看,如果设置成为crontab,其实管理起来是比较臃肿的。

993
来自专栏沃趣科技

Oracle 12c数据库优化器统计信息收集的最佳实践(三)|何时不需要收集统计信息

原文链接 http://www.oracle.com/technetwork/database/bi-datawarehousing/twp-bp-for-st...

2655
来自专栏Albert陈凯

2018-08-05 没有测试用例的代码,根本不应该跑在服务器上

在实际测试中,一个单元可以小到一个方法,也可以大到包含多个类。从定义上讲,单元测试和集成测试是有严格的区分的,但是在实际开发中它们可能并没有那么严格的界限。如果...

655

扫描关注云+社区