【直播】我的基因组 32:使用annovar注释vcf

ANNOVAR软件用法看我以前的博客: 1.Annovar使用记录 (http://www.bio-info-trainee.com/641.html) 2.用annovar对snp进行注释 (http://www.bio-info-trainee.com/441.html) 3.对感兴趣的基因call variation(http://www.bio-info-trainee.com/2013.html)4.WES(六)用annovar注释(http://www.bio-info-trainee.com/1158.html)

ANNOVAR是一个perl编写的命令行工具,能在安装了perl解释器的多种操作系统上执行。允许多种输入文件格式,包括最常被使用的VCF格式。输出文件也有多种格式,包括注释过的VCF文件、用tab或者逗号分隔的txt文件。ANNOVAR能快速注释遗传变异并预测其功能。类似的variants注释软件还有VEP,snpEff,VAAST,AnnTools等等。

这是annovar的第一讲,照例我们先简单试用一下它的基础功能,因为这样的遗传变异位点的注释软件,功能实在是太多了,但是它最基础的东西是根据变异位点的坐标已经现有研究已知基因结构坐标的信息来将变异进行分类,类别如下:

其中位于外显子上面的突变是尤为重要的,所以会重点分析:

两个步骤即可:

~/biosoft/ANNOVAR/annovar/convert2annovar.pl -format vcf4old realign.vcf >realign.annovar ~/biosoft/ANNOVAR/annovar/annotate_variation.pl -buildver hg19 --geneanno --outfile realign.anno realign.annovar ~/biosoft/ANNOVAR/annovar/humandb/

annovar默认的注释方式是:

Done with 50914 transcripts (including 11516 without coding sequence annotation) for 26271 unique genes

这个是最基础的注释,几分钟就完成了480万个位点的注释。

其中有31741个variation位点在外显子上面,是指的我们重点关注的,其中外显子的variation又可以分成下面几种情况:

一般公司会把上面的数据画成一个好看的饼图,但这不是我们的重点,分析自己的基因组数据是为了探究本质的东西,而不是浮于表面。

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2016-12-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏玉树芝兰

如何免费云端运行Python深度学习框架?

想运行TuriCreate,却没有苹果电脑,也没有Linux使用经验,怎么办?用上这款云端应用,让你免安装Python运行环境。一分钱不用花,以高性能GPU,轻...

1091
来自专栏AI研习社

深度学习训练时 GPU 温度过高?几行命令就可迅速降温!

新买回来的不带水冷公版GPU,在满负载运行的时候,温度从室温马上飙升到85度,而且模型训练不是几分钟完事,很有可能要长期保持在高温状态下运行,让如此昂贵的GPU...

3404
来自专栏鹅厂网事

可视化网络路径探测HashTrace

引子 长期以来,探究网络质量和探索网络路径是广大网络工作者监控网络的必备工作,ping用于探究网络质量和traceroute用于探索路径。对于探测结果似...

3098
来自专栏木子昭的博客

PDF转Word 用谷歌文档进行在线OCR识别

博主最近被人问到了这个问题, 也做了一番研究, 最终找到两个靠谱的方法, 分享一下

3962
来自专栏北京马哥教育

知乎美女挖掘指南--Python实现自动化图片抓取、颜值评分

声明:文中所有文字、图片以及相关外链中直接或间接、明示或暗示涉及性别、颜值分数等信息全部由相关人脸检测接口给出。无任何客观性,仅供参考。 1 数据源 知乎 话题...

4006
来自专栏木头编程 - moTzxx

PHP QRCode 生成二维码

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011415782/article/de...

1654
来自专栏hotqin888的专栏

技术人员价值评测系统Merit

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hotqin888/article/det...

902
来自专栏技术翻译

两种截然不同的部署ML模型方式

这不仅仅是在构建产品,在这种情况下,部署是必要的 - 如果您要为管理生成报告,它也适用。十年前,高管不会质疑假设并将自己的数字插入Excel表格以查看发生了哪些...

722
来自专栏大数据

UC Berkeley提出新型分布式执行框架Ray:有望取代Spark

译者|马卓奇 编辑|Natalie AI 前线导读:下一代人工智能应用程序需要不断地与环境交互,并从这些交互中学习。这对系统的性能和灵活性提出了新的要求,而现有...

2948
来自专栏工科狗和生物喵

《实时软件控制设计》MATLAB-PIL测试报告基于Qemu Cortex-M 3的环境

正文之前 首先,跟助教说声抱歉,我们组因为一些因素没有按时完成PIL的测试,还要申请延期。另外也感谢助教的催促,让我们能够在今天下午就完成PIL测试,也算是为本...

3558

扫码关注云+社区