前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【直播】我的基因组 31:vcf文件标记dbSNP的rsID号

【直播】我的基因组 31:vcf文件标记dbSNP的rsID号

作者头像
生信技能树
发布2018-03-08 10:15:57
2.4K0
发布2018-03-08 10:15:57
举报
文章被收录于专栏:生信技能树生信技能树

vcf文件标记dbSNP的rsID号的这个问题非常多的人问过,大部分的variation calling软件给出的vcf文件里面第3列都是一个纯粹的dot占位符,如下:

但是,我们往往想知道,这个染色体的这个坐标发现的这个变异,是否在dbSNP数据库里面出现呢?这里,我们可以用snpEFF软件套装里面的SnpSift工具,具体安装教程见前面第5讲。http://snpeff.sourceforge.net/SnpSift.html#annotate

首先,需要下载dbSNP数据库的文件,并且要保证基因组版本是一致的!

java -jar ~/biosoft/SnpEff/snpEff/SnpSift.jar annotate ~/annotation/variation/human/dbSNP/All_20160601.vcf.gz realign.vcf >realign.dbsnp.vcf

当然,仅仅是注释一个dbSNP 的ID意义不大,我们得理解为什么这样注释,没有基础知识背景的小伙伴还需要理解上面的dbSNP的含义。我们还可以分析480万variation里面哪一些是可以注释到dbSNP的,哪一些不能,它们这两种在测序深度或者杂合纯合上面有显著的区别吗?有染色体分布的偏好性吗?

我们都会在下一讲慢慢说明~~~

文:Jimmy、阿尔的太阳

图文编辑:吃瓜群众

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-12-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档