前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >表观转录调控之ChIP-seq和RNA-Seq联合分析

表观转录调控之ChIP-seq和RNA-Seq联合分析

作者头像
生信技能树
发布2022-03-03 14:26:19
3.4K0
发布2022-03-03 14:26:19
举报
文章被收录于专栏:生信技能树生信技能树

看了看我b站的免费ngs数据处理课程,发现多组学里面的表观转录调控,尤其是ChIP-seq和RNA-Seq联合分析最受欢迎。

其实这些各个技术流程的视频教程好几年前我就全部免费共享在b站,而且我同步分享了视频配套讲义和教辅材料;

  • 学徒第1月,基础知识介绍掌握:文档链接:https://mubu.com/doc/38tEycfrQg 密码:vl3q
  • 学徒第2月,RNA-seq数据分析实战训练:文档链接:https://mubu.com/doc/38y7pmgzLg 密码:p6fo
  • 学徒第3月,WES数据分析实战训练:文档链接:https://mubu.com/doc/1iDucLlG5g 密码:7uch
  • 学徒第4月,ChIP-seq数据分析实战训练:文档链接:https://mubu.com/doc/11taEb9ZYg 密码:wk29

基本上每个过来我这边学习一个月以上的学徒我都会让他们学习多种组学(围绕着中心法则),而且有了Linux基础和R语言能力后, 跟着我们的视频教程很容易就学会基础流程,毫无压力。

但是这个 表观转录调控之ChIP-seq和RNA-Seq联合分析 课程我没有设置练习题,课程获取方式

  • 视频首先可以在B站看到:https://www.bilibili.com/video/av77098514 (失效日期,随时),请尽快学习
  • 视频课程配套课件(幕布思维导图):https://mubu.com/doc/3Bd4aieYug (理论上不会失效)
  • 配套代码目前也是微云下载:https://share.weiyun.com/5qmxu7Z(失效日期,随时),请尽快保存

练习题

参考文章:(2019) The genomic landscape of estrogen receptor α binding sites in mouse mammary gland. PLoS ONE ,其公开的数据集是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE130032

可以看到是3个ChIP-seq数据:

代码语言:javascript
复制
GSM3723395 ERα ChIP-seq replicate 1
GSM3723396 ERα ChIP-seq replicate 2
GSM3723397 Input

每个 ERα 的ChIP-seq数据都需要去和Input数据对照分析,拿到peaks文件,作者给出来了:

代码语言:javascript
复制
GSM3723395_08122015.m6W.ER_2hE2.WT_rep1-Input.e8_peaks.bed.gz 140.5 Kb
GSM3723396_08122015.m6W.ER_2hE2.WT_rep2-Input.e8_peaks.bed.gz 100.7 Kb

以及4个RNA-Seq样品:

代码语言:javascript
复制
GSM3730458 Control rep1
GSM3730459 Control rep2
GSM3730460 Estradiol rep1
GSM3730461 Estradiol rep2

有意思的是作者这里并没有给出来4个样品的表达量矩阵,反而是给出来了如下所示的:

代码语言:javascript
复制
GSM3730458_Mouse_Mammary_Gland_6WK_WT_Control_rep1.wig.gz 339.4 Mb
GSM3730459_Mouse_Mammary_Gland_6WK_WT_Control_rep2.wig.gz 382.9 Mb
GSM3730460_Mouse_Mammary_Gland_6WK_WT_E2treat_rep1.wig.gz 588.1 Mb
GSM3730461_Mouse_Mammary_Gland_6WK_WT_E2treat_rep2.wig.gz 369.2 Mb

所以大家需要自己从这个文章里面的ChIP-seq和RNA-Seq的原始fastq文件开始,下载后,自己走我们的两个流程。就是前面的:

  • 学徒第2月,RNA-seq数据分析实战训练:文档链接:https://mubu.com/doc/38y7pmgzLg 密码:p6fo
  • 学徒第4月,ChIP-seq数据分析实战训练:文档链接:https://mubu.com/doc/11taEb9ZYg 密码:wk29

其中 ChIP-seq数据分析 拿到了peaks后跟文章的GSE130032对比,然后表达量矩阵就没办法跟原文对比了,他没有给出。

接下来是ERα 的ChIP-seq数据两个样品重复性很好

基本上就是一些质量控制的图表,如下所示:

两个样品重复性很好

把好几千的peaks根据基因组功能区域划分后,主要是分成3类:

  • distal upstream (-100kb to -1kb),
  • proximal (-1kb to +400 bp),
  • distal downstream (+400 bp to +100kb),

也可以独立看看其不同结合区域的motif:

不同结合区域的motif

这两个不同区域的motfi分析结果确实不一样:

  • distal区域(包括上下游)是 PAX2, ESRRB, SF1, and AP1 motifs
  • proximal区域是 ESRRB, SF1 and TAL

这个时候,仍然是标准分析。

转录组数据主要是差异分析和生物学功能富集

差异分析就是上下调基因的热图:

上下调基因的热图

上下调基因列表分开独立去进行生物学功能数据库注释:

生物学功能数据库注释

重头戏是ChIP-seq和RNA-Seq联合分析

其实就是取交集,因为ERα 的ChIP-seq数据得到的peaks对应的基因是已知并且固定的,所以把这个基因拿去跟转录组的差异分析上下调基因分别去取交集,做韦恩图,其中一个交集如下所示:

其中一个交集如下所示

并且对交集后的基因列表进行再次生物学功能数据库注释以及motif查看。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-01-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 练习题
  • 接下来是ERα 的ChIP-seq数据两个样品重复性很好
  • 转录组数据主要是差异分析和生物学功能富集
  • 重头戏是ChIP-seq和RNA-Seq联合分析
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档