【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布

我们在之前说到过bam文件还有55G大小,这样的文件,在很多时候都不方便查看和转移。而有些时候,我们只需要我们的测序数据在全基因组的测序深度这一个值,并不需要具体某条reads的碱基序列,碱基质量值。这样就可以把bam文件压缩为bw格式啦!需要了解一些文件格式:wig、bigWig和bedgraph文件详解

bam文件格式我就不多说了,就是sam的二进制压缩版本,前面我们也花费了大量的笔墨来描述它,而bw格式全称是bigwig格式,就是规定了全基因组数据的每个坐标区间的测序深度,标准释义如下:

Wiggle Track Format (WIG):http://genome.ucsc.edu/goldenPath/help/wiggle.html

bigWig Track Format :http://genome.ucsc.edu/goldenPath/help/bigWig.html

BedGraph Track Format :http://genome.ucsc.edu/goldenPath/help/bedgraph.html

这3种文件格式都是UCSC规定的,所以它提供了系列工具进行互相转换,

我这里用deeptools这个软件的bamCoverage工具来完成这个任务,命令如下:

bamCoverage -b P_jmzeng.final.bam -o P_jmzeng.final.bw

bamCoverage -b P_jmzeng.filter.rmdup.realgn.bam -o P_jmzeng.filter.rmdup.realgn.bw

关于这个软件的用法及安装方法,见我博客:deeptools辅助CHIP-seq数据分析-可视化(http://www.bio-info-trainee.com/2136.html 复制该地址到浏览器打开)

在IGV里面打开bam和bw文件,就知道这个软件到底做了什么。

首先对bw文件来说,可以在全基因组尺度下看看测序深度的整体情况,这样可以很明显的看到某些染色体的某些区域是不是严重的测序深度过低或者过高(我箭头所指的区域是有问题的,测序深度尤其高)。而对bam文件,需要zoom in到一定程度才能看到比对的reads情况。

通过bw的文件来定位异常区域,再zoom in去看具体是怎么回事,非常好用!可以看到这些区域测序深度高达8万!!!

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2016-12-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏点点滴滴

引物设计

1143
来自专栏生信技能树

参考基因组没有,经费也没那么多,怎么办?

尽管目前已经有大量物种基因组释放出来,但还是存在许多物种是没有参考基因组。使用基于酶切的二代测序技术,如RAD-seq,GBS,构建遗传图谱是研究无参考物种比较...

3717
来自专栏人工智能LeadAI

TensorFlow从0到1丨开篇:Hello TensorFlow !

我以官方文档为主线,开始对TensorFlow的学习。这期间会把我的理解进行持续的输出,作为《TensorFlow从0到1》系列。它不会止于翻译和笔记、语言和工...

4047
来自专栏Y大宽

TBtools基因家族分析详细教程(2)基因家族成员的基本分析

https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi

3553
来自专栏FreeBuf

使用Python和Tesseract来识别图形验证码

各位在企业中做Web漏洞扫描或者渗透测试的朋友,可能会经常遇到需要对图形验证码进行程序识别的需求。很多时候验证码明明很简单(对于非互联网企业,或者企业内网中的应...

4655
来自专栏小詹同学

知乎大神爬取高颜值美女(Python爬虫+人脸检测+颜值检测)

这是一篇来自知乎大神的技术文章 ---- 写在前面: 本文作者:邓卓 原文链接:本文转发修改已取得原作者授权 https://zhuanlan.zhihu.c...

6567
来自专栏软件

还是用RSeQC对比对后的转录组数据做一下质控

那个时候写教程,以软件安装,软件input和output为主,因为觉得新手最容易纠结的就是这些了,但是现在回过头来看,软件安装已经成了小菜一碟,对各种bam/s...

27310
来自专栏kangvcar

[face_recognition中文文档] 第7节 历史

1064
来自专栏CVer

重磅:TensorFlow实现YOLOv3(内含福利)

YOLO官网:YOLO: Real-Time Object Detection keras-yolo3:https://github.com/qqwweee/k...

8.7K16
来自专栏人人都是极客

第三课:把tensorflow,模型和测试数据导入Android工程

关于Android项目的创建这里就不做赘述了,我们直接进入主题,看下如何把机器学习库和训练的模型导入一个安卓应用中。 导入 Inference Interfac...

37012

扫码关注云+社区