【直播】我的基因组 44:比对文件画profile和heatmap图

就在昨天,一篇羞羞嗒的推送在各个群里炸开了锅。氮素,大家都是小清新啊

今天还是给大家规(wu)规(liao)矩(tou)矩(ding)讲一下比对文件怎样画profile和heatmap图。

这主要是针对于chip-seq数据分析的,但是针对全基因组测序数据呢,也可以说明一定的问题。

【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布

我这里会采用deeptools这个软件来探究测序数据关于各种genomic feature的profile和heatmap,安装deeptools及使用方法见我的博客,我就不再赘述(复制该网址:http://www.bio-info-trainee.com/2136.html或查看原文均可)。

这时候,需要下载genomic feature的文件,这个软件要求的bed格式的基因组注释信息,下载方式如下:

https://genome.ucsc.edu/cgi-bin/hgTables

这里运行的代码如下:

  1. date
  2. start=`date +%s`
  3. computeMatrix reference-point -p 10 --referencePoint TSS -b 2000 -a 2000 -S ../*bw -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed --skipZeros -o TSS.mat.gz
  4. plotHeatmap -m TSS.mat.gz -out TSS.merge.png
  5. plotProfile --dpi 720 -m TSS.mat.gz -out TSS.profile.pdf --plotFileFormat pdf --perGroup
  6. plotHeatmap --dpi 720 -m TSS.mat.gz -out TSS.merge.pdf --plotFileFormat pdf
  7. runtime=$((end-start))
  8. echo "Runtime for TSS was $runtime"
  9. date
  10. start=`date +%s`
  11. computeMatrix scale-regions -p 5 -S ../*bw -R ~/annotation/CHIPseq/hg19/ucsc.refseq.bed -b 3000 -a 3000 -m 5000 --skipZeros -o genebody.mat.gz
  12. plotHeatmap -m genebody.mat.gz -out genebody.merge.png
  13. plotProfile --dpi 720 -m genebody.mat.gz -out genebody.profile.pdf --plotFileFormat pdf --perGroup
  14. plotHeatmap --dpi 720 -m genebody.mat.gz -out genebody.merge.pdf --plotFileFormat pdf
  15. runtime=$((end-start))
  16. echo "Runtime for genebody was $runtime"

第一个genomic feature就是TSS附近的测序深度图,很明显,这5个lane的数据量不一样,但是它们的pattern是高度相似的。它们在TSS附近是有一个测序深度的peaks的,是因为TSS附近的GC含量不一致导致。并不是通常CHIP-seq的富集效应。

但是,下面这个,就是一个典型的CHIP-seq的数据可视化结果,很明显,可以看到,那些IP,都是有着4~6倍的富集效应。但是 IgG 就没有,是正常的GC含量富集效应。

这就是本次直播介绍的知识点!

还有一个是genebody这个genomic feature的可视化结果,但是我自己目前也不是很懂,欢迎各位高手留言讨论。

文:Jimmy

图文编辑:吃瓜群众

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-01-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Hadoop实操

Livy,基于Apache Spark的开源REST服务,加入Cloudera Labs

Hadoop生态圈的Spark(https://www.cloudera.com/products/open-source/apache-hadoop/apac...

3958
来自专栏FreeBuf

pyMagic:用python控制的Geek入门神器

原创作者:comover 大学四年快要结束了,这几年也学习了一点新的姿势。最近一直在跟国外的micropython项目,这个项目是由剑桥大学的理论物理学家(th...

2235
来自专栏知晓程序

活动 | 免费画头像名单公布!快来看看你中奖了吗

由于大家对「画个头」小程序的非常喜爱,一下子太多人访问,使得它的服务器在周日短暂地瘫痪了。

872
来自专栏web前端教室

本周日-先行者课程小总结

本周日的先行者课程,是用vue.js做一个点菜结账pos类的应用。 里面使用了vue-cli做为脚手架,使用了ElementUI做为前端组件库,主要的知识点包括...

1637
来自专栏张善友的专栏

IBM网站 构建您的SOA 系列文章

本系列文章包含三个部分,将在行业采用的流程和方法与 SOA 之间建立紧密的联系,并演示如何将其一起使用。  1. 构建您的 SOA: 第 1 部分,成熟度与...

1815
来自专栏BestSDK

谷歌版“小程序”上线,增加“立即试用”功能

今年1月份,Google在 I/O 开发者大会上正式宣布了Instant Apps。在这大半年里,Google 拉上了众多开发者共同改善 Instant App...

3608
来自专栏JackeyGao的博客

全宋词爬取过程及数据分析

.tagul-attribution { display: none; } .block { padding-bottom: 0 !impo...

622
来自专栏魏艾斯博客www.vpsss.net

搬瓦工 BandwagonHost 常见问题解答

1843
来自专栏州的先生

爬虫与资源|公务员考试来袭,一份人民日报时评资源献给你

882
来自专栏Android 开发者

【中文教学视频】Android Oreo 中的后台进程

1282

扫描关注云+社区