【直播】我的基因组 44:比对文件画profile和heatmap图

就在昨天,一篇羞羞嗒的推送在各个群里炸开了锅。氮素,大家都是小清新啊

今天还是给大家规(wu)规(liao)矩(tou)矩(ding)讲一下比对文件怎样画profile和heatmap图。

这主要是针对于chip-seq数据分析的,但是针对全基因组测序数据呢,也可以说明一定的问题。

【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布

我这里会采用deeptools这个软件来探究测序数据关于各种genomic feature的profile和heatmap,安装deeptools及使用方法见我的博客,我就不再赘述(复制该网址:http://www.bio-info-trainee.com/2136.html或查看原文均可)。

这时候,需要下载genomic feature的文件,这个软件要求的bed格式的基因组注释信息,下载方式如下:

https://genome.ucsc.edu/cgi-bin/hgTables

这里运行的代码如下:

  1. date
  2. start=`date +%s`
  3. computeMatrix reference-point -p 10 --referencePoint TSS -b 2000 -a 2000 -S ../*bw -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed --skipZeros -o TSS.mat.gz
  4. plotHeatmap -m TSS.mat.gz -out TSS.merge.png
  5. plotProfile --dpi 720 -m TSS.mat.gz -out TSS.profile.pdf --plotFileFormat pdf --perGroup
  6. plotHeatmap --dpi 720 -m TSS.mat.gz -out TSS.merge.pdf --plotFileFormat pdf
  7. runtime=$((end-start))
  8. echo "Runtime for TSS was $runtime"
  9. date
  10. start=`date +%s`
  11. computeMatrix scale-regions -p 5 -S ../*bw -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed -b 3000 -a 3000 -m 5000 --skipZeros -o genebody.mat.gz
  12. plotHeatmap -m genebody.mat.gz -out genebody.merge.png
  13. plotProfile --dpi 720 -m genebody.mat.gz -out genebody.profile.pdf --plotFileFormat pdf --perGroup
  14. plotHeatmap --dpi 720 -m genebody.mat.gz -out genebody.merge.pdf --plotFileFormat pdf
  15. runtime=$((end-start))
  16. echo "Runtime for genebody was $runtime"

第一个genomic feature就是TSS附近的测序深度图,很明显,这5个lane的数据量不一样,但是它们的pattern是高度相似的。它们在TSS附近是有一个测序深度的peaks的,是因为TSS附近的GC含量不一致导致。并不是通常CHIP-seq的富集效应。

但是,下面这个,就是一个典型的CHIP-seq的数据可视化结果,很明显,可以看到,那些IP,都是有着4~6倍的富集效应。但是 IgG 就没有,是正常的GC含量富集效应。

这就是本次直播介绍的知识点!

还有一个是genebody这个genomic feature的可视化结果,但是我自己目前也不是很懂,欢迎各位高手留言讨论。

文:Jimmy

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-01-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏技术小黑屋

Javac:command Not Found

I have been getting well on with my java tool.However When I use the javac comma...

892
来自专栏杨建荣的学习笔记

通过shell和sql结合查找性能sql(r2笔记68天)

在生产系统中,会发现一些潜在的sql问题,为了能够及时和准确的定位,我们可以借助sql_monitor来做性能sql的查找。可以在后台启用一个job不定时的去查...

3287
来自专栏张戈的专栏

HTTP加速器教程:《Varnish 应用技术指南 V2.1》

博主有个无厘头老大,要我研究新技术无可厚非,可总是换来换去就无语了!前段时间还要我研究 memcache,我才把 memcache 安装好,他昨天又要我去研究 ...

3628
来自专栏玄魂工作室

Hacker基础之Linux篇:系统简介特别番之Kali Linux

0x01. 前言 作为安全界的明星,Kali可以说是无人不知无人不晓,当然,除了Kali之外,我们还有许多的可以选择的工具,比如: ParrotSec ? ...

3156
来自专栏张戈的专栏

国内外流行的Linux发行版

近年来,Linux 开始获得越来越多的关注,那你知道国内外流行的 Linux 版本都有哪些吗?本文中整理了五大 Linux 发行版,他们分别是 RedHat、S...

34010
来自专栏大神带我来搬砖

记一次高级软件架构师的铩羽而归

前几天女朋友笔记本电脑开机后进不了系统了,鉴于我天天告诉她要用宏来处理Excel,于是耳提面命,让我来修修。当时我想,这有何难,哪有程序员修不了电脑的?正如马谡...

3248
来自专栏生信技能树

不编程就能完成差异表达分析

上几周,生信技能树的元老级人物果子发了一篇重量级文章数据库一网打尽:不会编程又怎样,还不照样拿课题发文章! 阅读量逼近4000,还超过了Jimmy的署名文一个全...

36011
来自专栏量子位

Python的“仁慈独裁者”累觉不爱,宣布退位

1144
来自专栏小白客

百度网盘下载器,建议收藏

百度网盘是目前国内最大的云存储软件,在日常生活中,我们进行分享、存储各种文件也是首选百度网盘,但是百度网盘的限速下载却是很让人头疼(只有开通会员才不被限速),...

34610
来自专栏L宝宝聊IT

Linux基础——OS简史

1164

扫码关注云+社区