前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布

【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布

作者头像
生信技能树
发布2018-03-08 10:21:32
7K0
发布2018-03-08 10:21:32
举报
文章被收录于专栏:生信技能树生信技能树

我们在之前说到过bam文件还有55G大小,这样的文件,在很多时候都不方便查看和转移。而有些时候,我们只需要我们的测序数据在全基因组的测序深度这一个值,并不需要具体某条reads的碱基序列,碱基质量值。这样就可以把bam文件压缩为bw格式啦!需要了解一些文件格式:wig、bigWig和bedgraph文件详解

bam文件格式我就不多说了,就是sam的二进制压缩版本,前面我们也花费了大量的笔墨来描述它,而bw格式全称是bigwig格式,就是规定了全基因组数据的每个坐标区间的测序深度,标准释义如下:

Wiggle Track Format (WIG):http://genome.ucsc.edu/goldenPath/help/wiggle.html

bigWig Track Format :http://genome.ucsc.edu/goldenPath/help/bigWig.html

BedGraph Track Format :http://genome.ucsc.edu/goldenPath/help/bedgraph.html

这3种文件格式都是UCSC规定的,所以它提供了系列工具进行互相转换,

我这里用deeptools这个软件的bamCoverage工具来完成这个任务,命令如下:

bamCoverage -b P_jmzeng.final.bam -o P_jmzeng.final.bw

bamCoverage -b P_jmzeng.filter.rmdup.realgn.bam -o P_jmzeng.filter.rmdup.realgn.bw

关于这个软件的用法及安装方法,见我博客:deeptools辅助CHIP-seq数据分析-可视化(http://www.bio-info-trainee.com/2136.html 复制该地址到浏览器打开)

在IGV里面打开bam和bw文件,就知道这个软件到底做了什么。

首先对bw文件来说,可以在全基因组尺度下看看测序深度的整体情况,这样可以很明显的看到某些染色体的某些区域是不是严重的测序深度过低或者过高(我箭头所指的区域是有问题的,测序深度尤其高)。而对bam文件,需要zoom in到一定程度才能看到比对的reads情况。

通过bw的文件来定位异常区域,再zoom in去看具体是怎么回事,非常好用!可以看到这些区域测序深度高达8万!!!

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-12-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档