前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >minfi 分析甲基化芯片数据-差异分析篇

minfi 分析甲基化芯片数据-差异分析篇

作者头像
生信修炼手册
发布于 2020-05-11 09:30:06
发布于 2020-05-11 09:30:06
2K00
代码可运行
举报
文章被收录于专栏:生信修炼手册生信修炼手册
运行总次数:0
代码可运行

对于DNA 甲基化芯片而言,探针水平的差异针对的是单个CpG位点,在大多数的研究中,比如cancer_vs_normal 中,单个差异的CpG位点并不能作为疾病的特异性的marker 。为了更好的研究实验条件和差异的关系,提出了CpG Region的概念,比如CpG island, CpG island shores, genomic block, generic 2-kb region 等,本质上都是基因组上的一段区域,这个区域内的甲基化水平和疾病更好的关联。

对于甲基化芯片的差异分析,有DMP(Differentially Methylated Positions)和 DMR (Differentially Methylated Regions) 两个水平的差异分析。

DMP

minfi中,使用dmpFinder 函数检测差异甲基化位点,用法示例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> beta  <- getBeta(GRset)
> group <- pData(GRset)$Sample_Group
> dmp    <- dmpFinder(beta, pheno = group  , type = "categorical")
> head(dmp)
            intercept         f         pval        qval
cg19029696 0.009953261 236143.80 4.611238e-11 3.65210e-08
cg27120667 0.011075634 109897.78 2.129062e-10 4.41389e-08
cg10282524 0.010144608  93225.51 2.958661e-10 4.41389e-08
cg24057373 0.010776002  80409.86 3.976899e-10 4.41389e-08
cg13822231 0.007569349  80299.18 3.987870e-10 4.41389e-08
cg16695835 0.009126379  75627.00 4.495818e-10 4.41389e-08

pheno参数用于指定样本的分组情况,这里的分组对应两种类型,第一种type=categorical, 表示分组是一个分类变量,比如常见的case/control 分组,第二种type=continuous, 表示分组是一个连续型的变量,比如根据样本的血压分成了不同的组别。

这里的样本分组实际上是在SampleSheet.csv 文件中指定的。

需要注意的是,在实际分析过程中,分组是离散型的还是连续型的变量,并没有严格意义上的定义,需要根据实际的情况去判定。

对于离散型的分组,也是我们最常见的分组情况,比如不同的实验处理,这种肯定没有争议,type的值一定是categorical; 对于连续的变量,则要根据情况处理,比如同样是血压这种连续型的变量,如果我只做了两到3组,其实可以根据排序分为低,中,高3组。如果实验设计就是希望比较血压高低的甲基化差异,则此时应该按照离散型的分组进行处理,将样本分成血压高和血压低两组。总而言之,要根据自己的实验目的,确定分组类型。

DMR

minfi 中,使用bumphunter 函数检测差异甲基化区域。用于本人认知有限,对于这个算法也讲不明白,只能是先把用法记下来

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> group <- pData(GRset)$Sample_Group
> designMatrix <- model.matrix(~ group)
> dmrs <- bumphunter(GRset,
                  design = designMatrix,
                  cutoff = 0.2, B=0, type="Beta")
> head(dmrs$table[,1:4], n =3 )
       chr    start      end      value
166862 chr6 32133550 32139120 -0.4813026
55020  chr6 32938830 32942808  0.4099533
54639  chr6 30710200 30712680  0.4192182

总结:

1.甲基化芯片的差异分析包括DMP和DMR两个水平的差异分析,其中,DMR更有有生物学意义,更加能够作为差异的marker; 2.DMP和DMR对应的算法比较复杂,如果深入理解是一件复杂的事情。虽然不明白算法原理,但是并不影响我们的分析。在minfi中提供了dmpFiner 和 bumphunter 函数,能够让我们方便的进行差异分析;

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
beta 值和 M 值: 衡量样本甲基化水平的金标准
在甲基化芯片中,一次检测的是很多细胞的甲基化状态。对于某个CpG 位点来说,有些细胞的这个位点是甲基化的,而另外的细胞是非甲基化的。
生信修炼手册
2020/05/11
5.2K0
minfi 分析甲基化芯片数据-pipeline篇(附完整代码)
对于如何使用minfi 分析甲基化芯片数据,我们在之前的文章中详细讲解了每一步处理的具体用法。今天主要给出一个piepeline, 包括从文件读取一直到最终的DMP/DMR差异结果。
生信修炼手册
2020/05/12
1.6K0
ChAMP 包分析450K甲基化芯片数据(一站式)
就有非常棒的一站式教程投稿,也因此我结识了优秀的六六,以及其教程大力推荐的R包作者,见:
生信技能树
2018/11/05
7.1K0
850K甲基化芯片数据的分析
作者是生信技能树组建的表观遗传学学习小组的小组长,前面已经发过一个: 学员分享-Chip-seq 实战分析流程 本文是看到生信技能树有个450K甲基化芯片数据处理传送门,我呢,恰好不久前用一个集成度很高的ChAMP包分析过850K的甲基化芯片数据。所以,就想着把自己的笔记整理下,可以和更多的小伙伴学习交流,还有个原因可能是因为这是四月份打算学生信时,接手的第一个任务,曲曲折折好几个月才跑通流程,遇到的坑也比较多,想记录下来。 我之前分析时是参考ChAMP包的源文档,非常详细的整个流程的介绍,但是,在笔记快整
生信技能树
2018/03/09
4.2K1
850K甲基化芯片数据的分析
ChAMP分析甲基化数据:标准流程
上次主要演示了ChAMP包需要的样本信息csv文件的制作以及IDAT数据读取过程。
医学和生信笔记
2022/11/15
9360
ChAMP分析甲基化数据:标准流程
minfi包处理甲基化数据
甲基化分析应知应会的另一个R包:minfi,ChMAP包的很多的函数都有minfi包的影子。
医学和生信笔记
2022/11/15
9250
minfi包处理甲基化数据
ChAMP甲基化芯片分析官方流程学习
ChAMP(Chip Analysis Methylation Pipeline)是一个用于Illumina 450K和850K DNA甲基化芯片数据分析的R包。它是一个全面的工具包,可以从数据预处理到差异甲基化分析和功能注释提供一站式解决方案。它特别适用于甲基化数据的批处理分析和高通量研究。
凑齐六个字吧
2025/01/17
1060
ChAMP甲基化芯片分析官方流程学习
ChAMP分析甲基化芯片数据-差异分析上篇
经过预处理之后的数据,就可以进行差异分析了。对于甲基化芯片而言,有两个方面的差异分析
生信修炼手册
2020/05/10
1.9K0
【生信文献200篇】59 利用DNA甲基化和RNA-seq分析获得乳腺癌DNA甲基化调控基因
英文标题 Identification of epigenetic modulators in human breast cancer by integrated analysis of DNA methylation and RNA-Seq data
生信菜鸟团
2021/08/25
1.4K0
【生信文献200篇】59 利用DNA甲基化和RNA-seq分析获得乳腺癌DNA甲基化调控基因
ChAMP分析TCGA结直肠癌的甲基化数据!
前面用几篇推文详细介绍了ChAMP包用于甲基化分析的流程,并使用肠癌领域的GSE149282进行了演示。
医学和生信笔记
2022/11/15
1.8K1
ChAMP分析TCGA结直肠癌的甲基化数据!
ChAMP 分析甲基化芯片数据-EpiMod篇
DNA甲基化会调控基因的表达水平,进而影响基因的相互作用。将基因的相互作用网络和差异甲基化信息结合起来,基于那些甲基化水平发生差异的基因,从整个相互作用网络挖掘出这些基因的相互作用模块,这些模块可以看是与样本表型数据相关的基因集合,这种研究方式叫做Functional Epigenetic Modules(FEMs), 也叫做hotspots。
生信修炼手册
2020/05/10
1.1K0
bsseq 进行差异甲基化分析
共6列数据,制表符分隔,每一行代表一个甲基化位点,前5列很好理解,描述甲基化位点的染色体位置和类别,默认情况下bbseq用于分析CpG类型的甲基化位点。当然其他类型的数据,比如CHG, CHH也支持,但是需要调整参数。Cov代表覆盖到这个位点的reads数,M代表其中发生了甲基化的reads数目。
生信修炼手册
2020/05/09
1.4K0
使用DSS包多种方式检验差异甲基化信号区域
哺乳动物基因组CpG位点通常集中在称为CpG岛(CpG island,CGI)的区域中,并且已知人基因启动子~60%含有CpG岛。CpG岛上下游不超过2000个碱基对(2kb)的基因组区域称为CpG“岛岸”(shores),其中CpG shelves指位于CpG shores 上下游2kb以内的区域,open sea指CpG islands、CpG shores和CpG shelves之外的其他区域。这4种情况形成了CpG resort。CpG位点的密度从island到open sea递减。
生信技能树jimmy
2020/03/27
2.4K0
DNA甲基化芯片分析02: DNA甲基化芯片基础知识
将整个基因组划分为Promoter, Body, 3UTR, Intergenic 4种区域,其中Promoter区又细分为TSS200, TSS1500, 5UTR, 1stExon 4种情况。
生信探索
2023/02/24
7710
甲基化测序数据分析之methylKit
我前面的甲基化教程主要是针对450k这样的芯片,所以champ流程就绰绰有余,很多小伙伴在咱们后台咨询甲基化测序数据分析,恰好最近实习生投稿: 下面是去年实习生的分享 methylKit是一个用于分析甲基化测序数据的R包,不仅支持WGBS,RRBS和目的区域甲基化测序,还支持oxBS-sq,TAB-seq等分析5hmc的数据。其核心功能是差异甲基化分析和差异甲基化位点和区域的注释。 主要步骤包括数据描述性分析,聚类、样品质量可视化、差异甲基化分析和注释特征等功能。 分析流程图如下: 参考资料: htt
生信技能树
2022/01/10
3.7K0
甲基化测序数据分析之methylKit
明码标价之甲基化差异分析
转眼间2021都过去了快三分之一,我们的明码标价专栏建设的进度条却纹丝不动,感觉略微有点尴尬,得加油啦!根据大家在我们《生信技能树》,《生信菜鸟团》以及《单细胞天地》公众号后台关键词查询频率来看,甲基化差异分析是一个高频需求,就先把它明码标价哈!
生信技能树
2021/04/29
1K0
明码标价之甲基化差异分析
ChAMP 分析甲基化芯片数据-差异分析下篇
对于甲基化芯片的差异分析,除了有探针水平的差异分析,还有差异甲基化区域DMR分析。
生信修炼手册
2020/05/10
1.8K0
甲基化芯片数据下载如何读入到R里面
数据是一切的开始,前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术。具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 。既然要开始甲基化芯片数据挖掘实战,那么首先要有数据咯!需要区别的是甲基化芯片样本的idat原始文件,以及甲基化信号值矩阵。前面我们介绍了如何在GEO里面下载甲基化数据,拿到的数据文件必须要导入到R里面才能分析,现在我们就讲一下不同数据如何导入R里面。
生信技能树
2020/02/20
2.3K0
甲基化信号值矩阵差异分析主要图表
同理,我们前面教程:450K芯片上面的甲基化探针到底需要进行哪些过滤 已经强调过了甲基化芯片数据分析的一些注意事项,以及标准代码,共享了大量的学习资料。现在一起来看看甲基化信号值矩阵差异分析主要图表吧,这样你拿到了我的标准代码,处理好你的数据后,也可以简单快速理解它。
生信技能树
2020/02/20
1.7K0
甲基化芯片的一般分析流程
同样的策略,我们也可以应用到其它领域的知识背景快速学习,比如我们的lncRNA系列,miRNA系列,现在我们一起学习一下甲基化吧。
生信技能树
2020/02/20
3.9K0
推荐阅读
相关推荐
beta 值和 M 值: 衡量样本甲基化水平的金标准
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验