首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【直播】我的基因组 32:使用annovar注释vcf

【直播】我的基因组 32:使用annovar注释vcf

作者头像
生信技能树
发布2018-03-08 10:17:13
2.2K0
发布2018-03-08 10:17:13
举报
文章被收录于专栏:生信技能树生信技能树

ANNOVAR软件用法看我以前的博客: 1.Annovar使用记录 (http://www.bio-info-trainee.com/641.html) 2.用annovar对snp进行注释 (http://www.bio-info-trainee.com/441.html) 3.对感兴趣的基因call variation(http://www.bio-info-trainee.com/2013.html)4.WES(六)用annovar注释(http://www.bio-info-trainee.com/1158.html)

ANNOVAR是一个perl编写的命令行工具,能在安装了perl解释器的多种操作系统上执行。允许多种输入文件格式,包括最常被使用的VCF格式。输出文件也有多种格式,包括注释过的VCF文件、用tab或者逗号分隔的txt文件。ANNOVAR能快速注释遗传变异并预测其功能。类似的variants注释软件还有VEP,snpEff,VAAST,AnnTools等等。

这是annovar的第一讲,照例我们先简单试用一下它的基础功能,因为这样的遗传变异位点的注释软件,功能实在是太多了,但是它最基础的东西是根据变异位点的坐标已经现有研究已知基因结构坐标的信息来将变异进行分类,类别如下:

其中位于外显子上面的突变是尤为重要的,所以会重点分析:

两个步骤即可:

~/biosoft/ANNOVAR/annovar/convert2annovar.pl -format vcf4old realign.vcf >realign.annovar ~/biosoft/ANNOVAR/annovar/annotate_variation.pl -buildver hg19 --geneanno --outfile realign.anno realign.annovar ~/biosoft/ANNOVAR/annovar/humandb/

annovar默认的注释方式是:

Done with 50914 transcripts (including 11516 without coding sequence annotation) for 26271 unique genes

这个是最基础的注释,几分钟就完成了480万个位点的注释。

其中有31741个variation位点在外显子上面,是指的我们重点关注的,其中外显子的variation又可以分成下面几种情况:

一般公司会把上面的数据画成一个好看的饼图,但这不是我们的重点,分析自己的基因组数据是为了探究本质的东西,而不是浮于表面。

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-12-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
命令行工具
腾讯云命令行工具 TCCLI 是管理腾讯云资源的统一工具。使用腾讯云命令行工具,您可以快速调用腾讯云 API 来管理您的腾讯云资源。此外,您还可以基于腾讯云的命令行工具来做自动化和脚本处理,以更多样的方式进行组合和重用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档