【直播】我的基因组 44:比对文件画profile和heatmap图

就在昨天,一篇羞羞嗒的推送在各个群里炸开了锅。氮素,大家都是小清新啊

今天还是给大家规(wu)规(liao)矩(tou)矩(ding)讲一下比对文件怎样画profile和heatmap图。

这主要是针对于chip-seq数据分析的,但是针对全基因组测序数据呢,也可以说明一定的问题。

【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布

我这里会采用deeptools这个软件来探究测序数据关于各种genomic feature的profile和heatmap,安装deeptools及使用方法见我的博客,我就不再赘述(复制该网址:http://www.bio-info-trainee.com/2136.html或查看原文均可)。

这时候,需要下载genomic feature的文件,这个软件要求的bed格式的基因组注释信息,下载方式如下:

https://genome.ucsc.edu/cgi-bin/hgTables

这里运行的代码如下:

  1. date
  2. start=`date +%s`
  3. computeMatrix reference-point -p 10 --referencePoint TSS -b 2000 -a 2000 -S ../*bw -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed --skipZeros -o TSS.mat.gz
  4. plotHeatmap -m TSS.mat.gz -out TSS.merge.png
  5. plotProfile --dpi 720 -m TSS.mat.gz -out TSS.profile.pdf --plotFileFormat pdf --perGroup
  6. plotHeatmap --dpi 720 -m TSS.mat.gz -out TSS.merge.pdf --plotFileFormat pdf
  7. runtime=$((end-start))
  8. echo "Runtime for TSS was $runtime"
  9. date
  10. start=`date +%s`
  11. computeMatrix scale-regions -p 5 -S ../*bw -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed -b 3000 -a 3000 -m 5000 --skipZeros -o genebody.mat.gz
  12. plotHeatmap -m genebody.mat.gz -out genebody.merge.png
  13. plotProfile --dpi 720 -m genebody.mat.gz -out genebody.profile.pdf --plotFileFormat pdf --perGroup
  14. plotHeatmap --dpi 720 -m genebody.mat.gz -out genebody.merge.pdf --plotFileFormat pdf
  15. runtime=$((end-start))
  16. echo "Runtime for genebody was $runtime"

第一个genomic feature就是TSS附近的测序深度图,很明显,这5个lane的数据量不一样,但是它们的pattern是高度相似的。它们在TSS附近是有一个测序深度的peaks的,是因为TSS附近的GC含量不一致导致。并不是通常CHIP-seq的富集效应。

但是,下面这个,就是一个典型的CHIP-seq的数据可视化结果,很明显,可以看到,那些IP,都是有着4~6倍的富集效应。但是 IgG 就没有,是正常的GC含量富集效应。

这就是本次直播介绍的知识点!

还有一个是genebody这个genomic feature的可视化结果,但是我自己目前也不是很懂,欢迎各位高手留言讨论。

文:Jimmy

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-01-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏静晴轩

Sublime Text 最新注册码分享

SublimeText,她作为强大而小巧,性感且快捷的编辑器,长时间以来,受众人青睐;对于个人来说,也是最常用代码编辑器,且没有之一(目前同时也会用 VsCod...

3783
来自专栏IT派

关于微信和Python的点点滴滴

微信自上线以来,一直没有自动回复的功能,想必是有他们的理念。但是有些人群,确实对此功能有一定需求,我举两个栗子:

1070
来自专栏生信宝典

人类微生物组计划 - 宏基因组/16S分析流程 bioBakery

bioBakery是NIH人类微生物组计划实施过程中开发的部分软件和使用教程的集合,主要由哈佛大学的Huttenhower实验室开发。提供了16S, 宏基因组,...

5783
来自专栏知晓程序

举报!这里有人,在光天化日之下聚众撸猫

但并不是每个人都有机会成为「猫奴」。这时候,你需要 「吸猫君」 ,来帮你开启「云吸猫」的生活。

902
来自专栏信安之路

CTF初识与深入

这段时间一直在忙活CTF相关的东西,从参赛者到出题人,刷过一些题,也初步了解了出题人的逻辑;这篇文章就简单地讲一下CTF如何入门以及如何深入的学习、利用CTF这...

1790
来自专栏V站

图片API丨网站如何接入Bing每天一更背景?

Bing,即必应。常常有些站都是千篇一律的底色背景,毫无新意,导致的即是访客一个一个访你友链都不访那些死鬼站长!这就是Bing每天一更背景,也十分的骚,需要的上...

2737
来自专栏腾讯社交用户体验设计

ISUX 2018 Calendar 获奖名单

791
来自专栏黑白安全

高清无码!比鬼片还刺激!且听“诡娃”远控的这首惊魂曲

近日,360云安全系统发现一款名为“诡娃”的远控木马,正通过钓鱼软件、网页挂马等多渠道扩散。“诡娃”除了能进行操控中招电脑等行为外,还会通过控制指令让中招机器弹...

1172
来自专栏知晓程序

海量高清二次元壁纸!快来把老婆抱回家吧

今天,知晓程序(微信号 zxcx0101)要给广大动漫迷们,推荐一款名叫「Soda 壁纸」小程序,导航用的是颜文字,图库里全是高清壁纸,十分带感。

962
来自专栏大数据挖掘DT机器学习

Python爬取链家网数据:新房楼盘价格分析

本文将详细讲解利用python爬虫收集了链家网800多条公开数据并作简单分析。数据真实性有待考查,本文仅作为数据分析入门者参考。 安装环境 Window 10 ...

4925

扫码关注云+社区

领取腾讯云代金券