【直播】我的基因组 32:使用annovar注释vcf

ANNOVAR软件用法看我以前的博客: 1.Annovar使用记录 (http://www.bio-info-trainee.com/641.html) 2.用annovar对snp进行注释 (http://www.bio-info-trainee.com/441.html) 3.对感兴趣的基因call variation(http://www.bio-info-trainee.com/2013.html)4.WES(六)用annovar注释(http://www.bio-info-trainee.com/1158.html)

ANNOVAR是一个perl编写的命令行工具,能在安装了perl解释器的多种操作系统上执行。允许多种输入文件格式,包括最常被使用的VCF格式。输出文件也有多种格式,包括注释过的VCF文件、用tab或者逗号分隔的txt文件。ANNOVAR能快速注释遗传变异并预测其功能。类似的variants注释软件还有VEP,snpEff,VAAST,AnnTools等等。

这是annovar的第一讲,照例我们先简单试用一下它的基础功能,因为这样的遗传变异位点的注释软件,功能实在是太多了,但是它最基础的东西是根据变异位点的坐标已经现有研究已知基因结构坐标的信息来将变异进行分类,类别如下:

其中位于外显子上面的突变是尤为重要的,所以会重点分析:

两个步骤即可:

~/biosoft/ANNOVAR/annovar/convert2annovar.pl -format vcf4old realign.vcf >realign.annovar ~/biosoft/ANNOVAR/annovar/annotate_variation.pl -buildver hg19 --geneanno --outfile realign.anno realign.annovar ~/biosoft/ANNOVAR/annovar/humandb/

annovar默认的注释方式是:

Done with 50914 transcripts (including 11516 without coding sequence annotation) for 26271 unique genes

这个是最基础的注释,几分钟就完成了480万个位点的注释。

其中有31741个variation位点在外显子上面,是指的我们重点关注的,其中外显子的variation又可以分成下面几种情况:

一般公司会把上面的数据画成一个好看的饼图,但这不是我们的重点,分析自己的基因组数据是为了探究本质的东西,而不是浮于表面。

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2016-12-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏北京马哥教育

知乎美女挖掘指南--Python实现自动化图片抓取、颜值评分

声明:文中所有文字、图片以及相关外链中直接或间接、明示或暗示涉及性别、颜值分数等信息全部由相关人脸检测接口给出。无任何客观性,仅供参考。 1 数据源 知乎 话题...

5096
来自专栏技术翻译

两种截然不同的部署ML模型方式

这不仅仅是在构建产品,在这种情况下,部署是必要的 - 如果您要为管理生成报告,它也适用。十年前,高管不会质疑假设并将自己的数字插入Excel表格以查看发生了哪些...

1572
来自专栏人工智能LeadAI

深度学习训练时GPU温度过高?几个命令,为你的GPU迅速降温。

新买回来的不带水冷公版GPU,在满负载运行的时候,温度从室温马上飙升到85度,而且模型训练不是几分钟完事,很有可能要长期保持在高温状态下运行,让如此昂贵的GPU...

6697
来自专栏图形学与OpenGL

《3D建模初步》参考资料

本门课程主要从3D打印角度来介绍3D建模的简单知识。课程采用免费的3D CAD软件Autodesk 123D Design来具体演示一些简单模型的构建方法,并介...

1261
来自专栏大数据

UC Berkeley提出新型分布式执行框架Ray:有望取代Spark

译者|马卓奇 编辑|Natalie AI 前线导读:下一代人工智能应用程序需要不断地与环境交互,并从这些交互中学习。这对系统的性能和灵活性提出了新的要求,而现有...

4138
来自专栏灯塔大数据

每周学点大数据 | No.77 众包算法实践——成为众包工人

编者按:灯塔大数据将每周持续推出《从零开始学大数据算法》的连载,本书为哈尔滨工业大学著名教授王宏志老师的扛鼎力作,以对话的形式深入浅出的从何为大数据说到大数据算...

46111
来自专栏木头编程 - moTzxx

PHP QRCode 生成二维码

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011415782/article/de...

1.8K5
来自专栏腾讯移动品质中心TMQ的专栏

测试建模 :从尔康的鼻孔说开来,重要的用例写三遍

看完本文你会了解以下内容 1. 什么是SUT模型 2. 测试建模在工作中究竟是怎样一个过程 3. 从业务流程到测试用例我们忽略了什么 4. 测试建模会有哪些产出...

2115
来自专栏工科狗和生物喵

《实时软件控制设计》MATLAB-PIL测试报告基于Qemu Cortex-M 3的环境

正文之前 首先,跟助教说声抱歉,我们组因为一些因素没有按时完成PIL的测试,还要申请延期。另外也感谢助教的催促,让我们能够在今天下午就完成PIL测试,也算是为本...

4218
来自专栏PPV课数据科学社区

【数据可视化专题】22个免费的数据可视化和分析工具推荐

本文总结推荐22个免费的数据可视化和分析工具。列表如下: ? 数据清理(Data cleaning) 当你分析和可视化数据前,常需要“清理”工作。比如一些输入性...

3115

扫码关注云+社区

领取腾讯云代金券