【直播】我的基因组 31:vcf文件标记dbSNP的rsID号

vcf文件标记dbSNP的rsID号的这个问题非常多的人问过,大部分的variation calling软件给出的vcf文件里面第3列都是一个纯粹的dot占位符,如下:

但是,我们往往想知道,这个染色体的这个坐标发现的这个变异,是否在dbSNP数据库里面出现呢?这里,我们可以用snpEFF软件套装里面的SnpSift工具,具体安装教程见前面第5讲。http://snpeff.sourceforge.net/SnpSift.html#annotate

首先,需要下载dbSNP数据库的文件,并且要保证基因组版本是一致的!

java -jar ~/biosoft/SnpEff/snpEff/SnpSift.jar annotate ~/annotation/variation/human/dbSNP/All_20160601.vcf.gz realign.vcf >realign.dbsnp.vcf

当然,仅仅是注释一个dbSNP 的ID意义不大,我们得理解为什么这样注释,没有基础知识背景的小伙伴还需要理解上面的dbSNP的含义。我们还可以分析480万variation里面哪一些是可以注释到dbSNP的,哪一些不能,它们这两种在测序深度或者杂合纯合上面有显著的区别吗?有染色体分布的偏好性吗?

我们都会在下一讲慢慢说明~~~

文:Jimmy、阿尔的太阳

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2016-12-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序员宝库

刚开始学编程?这几款小工具能让你事半功倍

1867
来自专栏玉树芝兰

如何用R和API免费获取Web数据?

API是获得Web数据的重要途径之一。想不想了解如何用R调用API,提取和整理你需要的免费Web数据呢?本文一步步为你详尽展示操作流程。

782
来自专栏NetCore

自己做的一个小程序 可采集、导出、模板、配置

去年老婆要开个店铺,卖化妆品的,不过输入数据的时候真的头疼,因为我们是没有货源的,都是从代理那里找图片、介绍等,不过好在代理有个网站,闲来无事,就开发了这个小程...

1926
来自专栏知晓程序

如何优雅地发朋友圈?你需要这款简洁好看的小程序

普通的一天中,我们能看到各种各样的风景。人来人往,相遇离别,每一天,都能产生新的故事和回忆。

1154
来自专栏Crossin的编程教室

【每周一坑】螺旋矩阵

今天这题,看起来挺简单,实际写出来并不容易。在以前公司我曾把它做过招聘的笔试题,结果惨不忍睹,不得不拿掉。 输出如图的螺旋矩阵: 1 2 3 4...

3157
来自专栏大数据杂谈

Google Colab 免费GPU服务器使用教程

2248
来自专栏华章科技

7大笔记应用,让你的代码效率翻7倍

但是大多数笔记应用的设计并不是以程序员作为目标受众,这些程序可能会让使用者用起来很难受,甚至完全放弃这些工具。这就是为什么我们为你找来了这些最好的笔记工具。快来...

722
来自专栏互联网开发者交流社区

SEO-发信息注意的问题

1123
来自专栏生信技能树

生信蓝领,一个不舍得分享的高通量数据分析框架

安装bcbio框架 软件安装 配置参考基因组 流程配置 手动创建 脚本创建 简单实战 总结 当我跑完一些分析流程,比如说RNA-Seq,重测序分析以后,我就想到...

38411
来自专栏阮一峰的网络日志

国内用户访问维基百科(Wikipedia)的几种方法

世界上最受欢迎的网站之一、知识宝库"维基百科"(Wikipedia.org)在中国大陆是被封锁的,必须借助代理服务器才能打开。

261

扫描关注云+社区