【直播】我的基因组 34:Qualimap对比对好的bam文件进行统计及可视化

上一讲我们说道Qualimap这个软件,那我们现在仔细了解下这个软件吧!

比如下面这个覆盖度与测序深度的图来说:

如果我们自己要对55G的bam文件进行统计,可以sort好之后用samtools的mpileup功能来自己写脚本来区分染色体,分别统计覆盖度和测序深度,再绘图。但其实有很多优秀的工具也可以做到,而且是一步到位,还附送非常多的其它统计指标,比如Qualimap,有点类似于fastqc,也非常好用!

软件安装如下:

## Download and install Qualimap ## http://qualimap.bioinfo.cipf.es/ cd ~/biosoft mkdir Qualimap && cd Qualimap wget https://bitbucket.org/kokonech/qualimap/downloads/qualimap_v2.2.1.zip ## readme http://qualimap.bioinfo.cipf.es/doc_html/index.html ## example results :http://kokonech.github.io/qualimap/HG00096.chr20_bamqc/qualimapReport.html ~/biosoft/bamtools/bamtools/bin/bamtools ~/biosoft/Qualimap/qualimap_v2.2.1/qualimap --help

软件安装之后使用非常简单,而且我们只使用它的bamqc的功能命令如下:

~/biosoft/Qualimap/qualimap_v2.2.1/qualimap --java-mem-size=35G bamqc -bam ~/data/project/myGenome/bamFiles/P_jmzeng.final.bam

而且它不需要再对每条染色体分别处理了,因为它本身就自带这个统计机制。至于这个软件做了什么呢,我已经把它的报告上传到网络了,大家可以点击查看原文来了解或者复制链接到浏览器 http://www.biotrainee.com/jmzeng/blogMyGenome/P_jmzeng_Qualimap_results/qualimapReport.html,其实也就是我们前面对bam文件的一些解析而已,没什么意思,讲这两个软件,只是告诉大家,对于生信工作者来说,学习一个新的软件的用法应该是非常简单的事情。

文:Jimmy、吃瓜群众

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2016-12-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏架构师小秘圈

HDFS极简教程

HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Goog...

3226
来自专栏CSDN技术头条

通过可视化来了解你的Spark应用程序

本文为CSDN原创编译文章,禁止转载。 【编者按】在"Spark 1.4:SparkR发布,钨丝计划锋芒初露"一文中,我们有简单地介绍了1.4版本给Spark注...

24710
来自专栏生信技能树

【直播】我的基因组 33:用samstat软件对sam文件做统计

在此之前,我不止一次强调过QC的重要性,对全基因组测序等以找variation为主的分析流程来说,不仅仅是对测序数据的QC,还有比对之后的sam/bam文件也需...

39313
来自专栏aCloudDeveloper

Docker 网络背后的原理探索

知其然而不知其所以然,不知也。老古人说得多好,学知识不懂得知识背后的原理,等于白学。

950
来自专栏PPV课数据科学社区

干货 | 98道常见Hadoop面试题及答案解析(一)

这是一篇hadoop的测试题及答案解析,题目种类挺多,一共有98道题,题目难度不大,对于高手来说,90分以上才是你的追求。 1 单选题 1.1 下面哪个程序负责...

3044
来自专栏大数据文摘

手把手 | AWS上穷玩儿机器攻略 如何省下八成开支

2035
来自专栏ATYUN订阅号

你一定要知道!数据科学家提高工作效率的基本工具

当开始从事数据科学相关行业的时候,很多人都会被各种各样的可用工具所困扰。 有一些与这个问题相关的可用指南。例如“对于不擅长编程者的19日数据科学工具(链接地址为...

2944
来自专栏生信技能树

从WGS测序得到的VCF文件里面提取位于外显子区域的【直播】我的基因组84

首先要下载并且得到人类基因组的外显子坐标记录文件 这里我用的参考基因组版本仍然是hg19,所以去CCDS数据库里面下载对应版本,并且格式化成BED文件。 wge...

3719
来自专栏杨建荣的学习笔记

Oracle数据误操作全面恢复实战(r11笔记第78天)

对于DBA来说,面对误操作带来的数据恢复难度,其实很大。主要有以下几个方面: 误操作的影响范围极大,很可能不是删点,改点数据的操作,有时候可能是让人望而兴叹...

3325
来自专栏程序员八阿哥

小白Pycharm使用(6):如何使用 Python 开始建立你的数据分析项目

现在有很多博文对复杂的机器学习算法和前沿的技术进行了展示,而这也促使数据科学家们慢慢变成了“社交控”FOMO。但数据分析的基本内容究竟是什么样的?你应当怎样安排...

833

扫码关注云+社区