专栏首页生信修炼手册教你分析后缀为gpr的芯片数据

教你分析后缀为gpr的芯片数据

分析芯片数据,我们首先需要确定芯片平台。不同的芯片平台技术不同,既有单通道,也有双通道,而且输出文件的格式也不同。

目前常见的平台有以下几种

1.g enepix

2. illumina beadchip

3. Agilent

4. Affymetrix

对于前三种平台而言,我们都可以通过limma包来进行处理, 本文主要介绍genepix的芯片处理。

示例文件如下

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE123273

可以看到原始数据是后缀为gpr的文件

gpr文件格式的解释可以查看如下链接

https://support.moleculardevices.com/s/article/GenePix-File-Formats#gpr

对于该种类型的文件,其读取的代码如下

> files <- c("GSM3498849_1.gpr", "GSM3498850_2.gpr", "GSM3498851_3.gpr")
> RG <- read.maimages(files, source="genepix")
Read GSM3498849_1.gpr
Read GSM3498850_2.gpr
Read GSM3498851_3.gpr

读取之后,就可以按照如下步骤进行分析

1. 背景校正

2. 归一化

3. 差异分析

详细代码示例如下

> RG <- backgroundCorrect(RG, method="normexp")
Array 1 corrected
Array 2 corrected
Array 3 corrected
Array 1 corrected
Array 2 corrected
Array 3 corrected
> MA <- normalizeWithinArrays(RG)
# design参数设置样本分组
> fit <- lmFit(MA, design=c(-1,1,1))
> fit <- eBayes(fit)
> topTable(fit)
      Block Row Column     ID            Name       logFC  AveExpr         t
5885     14   8     11 168760 hsa-miR-4749-5p  0.01300731 5.741990  4.761650
12659    29  16      9 147276 hsa-miR-3616-3p  0.01229513 5.799412  4.412873
15751    36  16     21 148139                  0.01121546 7.842754  4.306584
11168    26   8     14 168593 hsa-miR-4726-3p -0.01151703 5.808141 -4.305364
12498    29   9      2 168858 hsa-miR-4638-3p  0.01260462 5.786310  4.302333
6889     16  14      3 146021                  0.01419926 6.284739  4.230745
3154      8   4      8 146104                 -0.01090889 5.837304 -4.211572
12422    29   5     14 147887    hsa-miR-3147 -0.01091577 5.800989 -4.192148
7157     17   6      7 148290 hsa-miR-3616-5p  0.01202037 5.825296  4.114572
9789     23   5     21 147799 hsa-miR-3156-5p  0.01090652 6.227845  4.113549
          P.Value adj.P.Val         B
5885  0.009187984 0.8836195 -3.202626
12659 0.011921747 0.8836195 -3.516772
15751 0.012945237 0.8836195 -3.615882
11168 0.012957595 0.8836195 -3.617029
12498 0.012988347 0.8836195 -3.619880
6889  0.013741047 0.8836195 -3.687594
3154  0.013951536 0.8836195 -3.705856
12422 0.014168777 0.8836195 -3.724413
7157  0.015078212 0.8836195 -3.799079
9789  0.015090679 0.8836195 -3.800071
文章分享自微信公众号:
生信修炼手册

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

作者:lzyg
原始发表时间:2022-04-11
如有侵权,请联系 cloudcommunity@tencent.com 删除。
登录 后参与评论
0 条评论

相关文章

  • gpr格式的芯片原始数据处理(神技能)

    我在生信技能树和生信菜鸟团都系统性总结过常见GEO数据库的芯片处理技巧,但是也有一些小众芯片我懒得去研发它的流程。但是我们生信技能树R语言之统计可视化讲师小洁却...

    生信技能树
  • 850K甲基化芯片数据的分析

    作者是生信技能树组建的表观遗传学学习小组的小组长,前面已经发过一个: 学员分享-Chip-seq 实战分析流程 本文是看到生信技能树有个450K甲基化芯片数据处...

    生信技能树
  • 为运营分析而设计的数据系统

    OPAP系统构建了一个实时查询的系统可以使用者立马能够查询到实时数据。举个简单的例子,当用户参加一项活动时,产品经理或者是运营人员希望能够马上获得用户的参与效果...

    哒呵呵
  • 教你几个Excel常用的数据分析技巧!

    工作之中,一些简单的数据处理工作都会选择用Excel完成,其实微软给我们开了个玩笑,它将一些好用的功能给隐藏起来了,比如“数据分析”,“规划求解”工具栏。我也是...

    1480
  • 【实战】手把手教你数据分析实操--以在线教育为例!

    数据来源于kaggle上关于2012-2016年Harvard and MIT两校在edX开设在线课程情况的研究。该数据集中共有290个在线课程的数据,字段信息...

    1480
  • 数据分析师教你几种常见的数据分析方法_上海互联网数据分析

    通过实时访问趋势了解产品使用情况,便于产品迅速迭代。访问用户量、访问来源、访问用户行为三大指标对于趋势分析具有重要意义。

    Python研究者
  • 教你用数据分析的方法追女神

    一年一度的情人节虽然已经过去了,很多单身的朋友又度过了一个没有情人的情人节,为了让各位单身的朋友在下一个情人节能有佳人相伴,现在就把追女神秘笈之大数据版本奉献给...

    小莹莹
  • 【用户】以用户为中心的网站数据分析

    以用户为中心的网站数据分析(User Centered Analysis)并不是一个全新的概念,国外很早就有以用户为中心的设计(User Centered De...

    CDA数据分析师
  • 教你3个书中无法学到的数据分析知识

    在大数据特别热门的今天,出现了各种培训课程。但我发现这些课程的重点都放在算法的学习上。如何理解logistic回归或深度学习的确很酷,但一旦你开始处理数据,你会...

    CDA数据分析师
  • 五个趣味案例教你数据分析的基本思想

    今天和大家分享一下数据分析的一些基本思想,我给它起了个名字叫做用数据说话。 用数据说话,就是用真实的数据说真实的话!真实也可以理解为求真务实。那么,数据分析就是...

    机器学习AI算法工程
  • 结肠腺癌细胞系过表达apoM的芯片数据分析

    比如GSE162325这个数据集,它比较新:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1623...

    生信技能树
  • 【生信文献200篇】89 T细胞亚群丰度分析工具:ImmuCellAI

    「英文标题:」 ImmuCellAI: A Unique Method for Comprehensive T-Cell Subsets Abundance P...

    生信菜鸟团
  • 基因芯片数据分析(五):edgeR包的基本原理

    在转录组测序(RNA-Seq)中,基因的表达量是我们关注的重点。基因表达量的衡量指标有:RPKM、FPKM、TPM。

    DoubleHelix
  • 以海底捞数据分析为例:餐饮行业数据挖掘分析的思路和方法

    很多人会对数据分析和挖掘的意义产生疑问,比如数据哪里来的,比如分析完了到底有什么用,能不能带来利润的增加呢?

    沉默的白面书生
  • 以海底捞数据分析为例:餐饮行业数据挖掘分析的思路和方法

    沉默的白面书生
  • Nvidia或将以70亿美元收购Mellanox,推动为数据中心制造芯片的业务

    知情人士透露,Nvidia即将以超过70亿美元的现金收购同行Mellanox Technologies。这笔交易将是Nvidia有史以来最大规模的收购,并推动其...

    AiTechYun
  • 【手把手教你】搭建自己的量化分析数据库

    数据是金融量化分析的重要基础,包括股票历史交易数据、上市公司基本面数据、宏观和行业数据等。随着信息流量的日益膨胀,学会获取、查询和加工数据信息变得越来越重要。对...

    Python进阶者
  • 为你还原一个纯粹地道的「数据分析岗」

    导读:只要是在科技创新领域的公司,纷纷都挂出来了急招“数据分析师”的牌子。但是很多人对它的概念并不了解,本文为你一一道来数据分析岗的功能目的,以及组建方式,干货...

    CDA数据分析师
  • 用数据分析的方法教你如何获得一份美好的爱情~

    一 为什么做爱情战略分析? 基于对爱情的三个重要假设 1、爱情是稀缺的情感资源: 由于是稀缺资源,因此爱情存在竞争和选择,只有理性决策,才能在有限的资源约束下对...

    小莹莹

扫码关注腾讯云开发者

领取腾讯云代金券