前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言实现多来源微阵列数据标准化

R语言实现多来源微阵列数据标准化

作者头像
一粒沙
发布2019-07-31 11:37:22
1K0
发布2019-07-31 11:37:22
举报
文章被收录于专栏:R语言交流中心R语言交流中心

大家应该对GEO数据很是熟悉,其存储了大量微阵列数据。我们平时都是log2()解决数据标准化的问题,今天给大家介绍一个专门用来对大量公共研究测序的微阵列数据进行数据标准化的R包frma(Frozen RobustMultiarray Analysis),从而解决多来源微阵列数据的差异性问题。其安装还是依赖于bioconductor,在这里多说一句,如果你的R语言是3.5以上版本,可以直接安装一个bioMager的包,这个就是bioconductor管理包的工具,如果没有达到3.5,那只有使用老方法了:

source("https://bioconductor.org/biocLite.R")

biocLite("frma")

biocLite("frmaExampleData")#实例数据文件

biocLite("hgu133afrmavecs")#实例数据参考文件

下面我们介绍下frma包的使用:

首先是数据的引入,我们引入的数据是通过affy包对cell处理过的affyBatch数据格式:

library(frmaExampleData)

data(AffyBatchExample)

接下来是数据的读入,此处用到frma的核心函数frma,对原始数据进行转化:

object <- frma(AffyBatchExample)

e <- exprs(object)#对以上object的进行转化,构成表达数据矩阵:

我们可以利用函数barcode评估以上样本数据的表达分布情况,具体函数参数:

其中的platform包括GPL96,GPL570, GPL571, GPL1261, GPL6244, GPL6246,或直接设置为Null;output可以自行设置输出p-value, z-score, lod, 或 binary

我们可以利用GNUSE函数对我们得到的数据进行质量的评估:

其展示形式多样:

GNUSE(object,type="stats")

GNUSE(object,type="plot")

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 R语言交流中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
批量计算
批量计算(BatchCompute,Batch)是为有大数据计算业务的企业、科研单位等提供高性价比且易用的计算服务。批量计算 Batch 可以根据用户提供的批处理规模,智能地管理作业和调动其所需的最佳资源。有了 Batch 的帮助,您可以将精力集中在如何分析和处理数据结果上。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档