前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >minfi 分析甲基化芯片数据-差异分析篇

minfi 分析甲基化芯片数据-差异分析篇

作者头像
生信修炼手册
发布于 2020-05-11 09:30:06
发布于 2020-05-11 09:30:06
2K00
代码可运行
举报
文章被收录于专栏:生信修炼手册生信修炼手册
运行总次数:0
代码可运行

对于DNA 甲基化芯片而言,探针水平的差异针对的是单个CpG位点,在大多数的研究中,比如cancer_vs_normal 中,单个差异的CpG位点并不能作为疾病的特异性的marker 。为了更好的研究实验条件和差异的关系,提出了CpG Region的概念,比如CpG island, CpG island shores, genomic block, generic 2-kb region 等,本质上都是基因组上的一段区域,这个区域内的甲基化水平和疾病更好的关联。

对于甲基化芯片的差异分析,有DMP(Differentially Methylated Positions)和 DMR (Differentially Methylated Regions) 两个水平的差异分析。

DMP

minfi中,使用dmpFinder 函数检测差异甲基化位点,用法示例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> beta  <- getBeta(GRset)
> group <- pData(GRset)$Sample_Group
> dmp    <- dmpFinder(beta, pheno = group  , type = "categorical")
> head(dmp)
            intercept         f         pval        qval
cg19029696 0.009953261 236143.80 4.611238e-11 3.65210e-08
cg27120667 0.011075634 109897.78 2.129062e-10 4.41389e-08
cg10282524 0.010144608  93225.51 2.958661e-10 4.41389e-08
cg24057373 0.010776002  80409.86 3.976899e-10 4.41389e-08
cg13822231 0.007569349  80299.18 3.987870e-10 4.41389e-08
cg16695835 0.009126379  75627.00 4.495818e-10 4.41389e-08

pheno参数用于指定样本的分组情况,这里的分组对应两种类型,第一种type=categorical, 表示分组是一个分类变量,比如常见的case/control 分组,第二种type=continuous, 表示分组是一个连续型的变量,比如根据样本的血压分成了不同的组别。

这里的样本分组实际上是在SampleSheet.csv 文件中指定的。

需要注意的是,在实际分析过程中,分组是离散型的还是连续型的变量,并没有严格意义上的定义,需要根据实际的情况去判定。

对于离散型的分组,也是我们最常见的分组情况,比如不同的实验处理,这种肯定没有争议,type的值一定是categorical; 对于连续的变量,则要根据情况处理,比如同样是血压这种连续型的变量,如果我只做了两到3组,其实可以根据排序分为低,中,高3组。如果实验设计就是希望比较血压高低的甲基化差异,则此时应该按照离散型的分组进行处理,将样本分成血压高和血压低两组。总而言之,要根据自己的实验目的,确定分组类型。

DMR

minfi 中,使用bumphunter 函数检测差异甲基化区域。用于本人认知有限,对于这个算法也讲不明白,只能是先把用法记下来

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> group <- pData(GRset)$Sample_Group
> designMatrix <- model.matrix(~ group)
> dmrs <- bumphunter(GRset,
                  design = designMatrix,
                  cutoff = 0.2, B=0, type="Beta")
> head(dmrs$table[,1:4], n =3 )
       chr    start      end      value
166862 chr6 32133550 32139120 -0.4813026
55020  chr6 32938830 32942808  0.4099533
54639  chr6 30710200 30712680  0.4192182

总结:

1.甲基化芯片的差异分析包括DMP和DMR两个水平的差异分析,其中,DMR更有有生物学意义,更加能够作为差异的marker; 2.DMP和DMR对应的算法比较复杂,如果深入理解是一件复杂的事情。虽然不明白算法原理,但是并不影响我们的分析。在minfi中提供了dmpFiner 和 bumphunter 函数,能够让我们方便的进行差异分析;

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验