前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >6种免疫细胞的850K甲基化芯片和转录组测序数据资源

6种免疫细胞的850K甲基化芯片和转录组测序数据资源

作者头像
生信技能树
发布2021-12-27 16:45:22
7690
发布2021-12-27 16:45:22
举报
文章被收录于专栏:生信技能树生信技能树

看到很多小伙伴翻来覆去就是TCGA数据挖掘,而且绝大部分都仅限于转录组数据,虽然会根据基因性质拆分成为蛋白编码基因和非编码,但是数据多样性真的好有限。非常有必要系统性整理一些公共数据资源推广开。

比如在李程老师的交流群看到了Roy et al., 于2021年11月发表在, Immunity 杂志的文章:《DNA methylation signatures reveal that distinct combinations of transcription factors specify human immune cell epigenetic identity》,链接是:https://doi.org/10.1016/j.immuni.2021.10.001

就做了6种免疫细胞的850K甲基化芯片和转录组测序数据,数据都是公开是:

代码语言:javascript
复制
Methylation data         GEO: GSE184269
RNASeq data This paper   GEO: GSE184264
EBF1 Chip-Seq data       GEO: GSE183537

可以很清楚看到免疫细胞分类情况:

免疫细胞分类情况

主要是淋巴系和髓系免疫细胞,做过单细胞转录组数据处理的小伙伴应该是很熟悉了,淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)。

首先是6种免疫细胞的850K甲基化芯片数据

链接是;https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE184269 使用的是Infinium MethylationEPIC芯片,就是850K甲基化芯片,有167个样品:

差异分析策略如下所示:

差异分析策略

可以看到,每次差异分析都是取其中一个分组都是跟其它的全部样品进行差异分析,差异分析结果可视化:

差异分析结果可视化

主要是统计了各个细胞亚群跟其它样品的甲基化差异数量,而且取这些位点进行热图可视化!

有差异的甲基化位点对应的基因的生物学功能数据库注释:

生物学功能数据库注释

差异分析的前提是数据质量OK,哪怕是甲基化矩阵,也需要同样的质量控制 :

主成分

甲基化测序的 WGBS和RRBS,还有 芯片是最高频的甲基化技术,其中甲基化芯片数据处理我是有视频课程的,首先需要阅读我在生信技能树的甲基化系列教程,目录如下

然后就可以看我在B站免费分享的视频课程《甲基化芯片(450K或者850K)数据处理 》

  • 教学视频免费在:https://www.bilibili.com/video/BV177411U7oj
  • 课程配套思维导图:https://mubu.com/doc/1cwlFgcXMg

然后是6大组蛋白的修饰的ChIP-seq数据

文章里面的ChIP-seq数据并不研究者自己产出的, 来自于 Roadmap 表观计划, 是:6 chromatin marks H3K4me3, H3K4me1, H3K36me3, H3K27me3, H3K9me3 and H3K27ac) ,

如果你对这些组蛋白修饰不理解,可以去参考2013年npg的一篇review:《Histone modifications for human epigenome analysis》,介绍了 不同组蛋白修饰的不同生物学功能哦。通常组蛋白修饰得到的是ChIP-seq数据,如果要分析:

  • 首先走上游ChIP-seq流程,即选取唯一比对的bam的序列拿去走MACS2找peaks
  • 然后学会deeptools工具探索比对结果,及信号特征:包括信号热图,信号强度profile,样本相关性图 IGV可视化
  • 学会 ChIPQC 和 DiffBind 两个R包
  • bedtools对bam文件看 全基因组各个染色体的reads密度图
  • peaks的数量,长度特特征,基因特征(外显子,内含子,UTR,启动子)注释及motif查找

最后是转录组测序数据

虽然中文仅仅是展现了差异基因的热图,但是背后提炼的信息也不少,而且跟差异甲基化位点进行了结合:

差异基因的热图

有意思的是这个热图的图例还蛮丰富的:

(A) RNA-seq was carried out with RNA from each cell type from 26 donors across the age range (Figures S6A and S6B). Normalized counts per million (CPM) values were compared pairwise within individuals using DESeq2 to identify differentially expressed genes. Genes with R4-fold change in a cell type compared to all other cell types within an individual and shared by all individuals irrespective of age are referred to as cell selective. Row Z score derived from normalized CPM for each cell type as well as PBMCs and whole blood are shown for each donor (columns). Darker shade in the pie charts show the proportion of cell-selective genes that are present in the MethylationEPIC array and contain cell-specific hypo- (orange) or hypermethylated (dark blue) sites.

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-12-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 首先是6种免疫细胞的850K甲基化芯片数据
  • 然后是6大组蛋白的修饰的ChIP-seq数据
  • 最后是转录组测序数据
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档