前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >「Workshop」第二十四期 GEO芯片数据处理-1

「Workshop」第二十四期 GEO芯片数据处理-1

作者头像
王诗翔呀
发布2020-11-20 10:26:31
1.2K0
发布2020-11-20 10:26:31
举报
文章被收录于专栏:优雅R优雅R

基本概念

1.GEO:芯片数据的代表(动物)

  • GSE---一个完整的研究,并提供了整个研究的描述,包括对数据的描述,总结分析。(series)
  • GSM---用户提交给GEO的样本数据 (samples)
  • GPL---用户测序使用的芯片/平台(platform)

image-20201115215200260

  • 基因表达芯片

image-20201115215238403

image-20201115215305973


2.回归最初的问题:为什么要进行数据分析?


3.几个核心概念:

3.1 表达矩阵

3.2差异分析

  • 主成分分析(Principal Component Analysis,PCA):作用:观察组别间的差异 主要概念:主成分---几个变量组成的 综合变量。

image-20201115215446070

图中的Dim1~Dim2分别是指主成分1和主成分2, Dim1代表解释数据变化趋势最多的主成分,Dim2则是解释变化趋势第二多的主成分。括号内的百分比则是代表了不同主成分所能解释数据变化趋势的比例。中心位置的大点代表该组的位置。一个点是一个sample,点距离代表相似性(差异)。

  • limma包:本质上就是一个R包和里面的函数。

logFC&P.value

log2(treat/control)=log2(treat)-log2(control)

通常所说的上、下调基因是指 基因表达量显著上、下调的基因:

  • volcano&heatmap

3.3 富集分析

  • GO
  • KEGG

image-20201115220057450


数据分析思路

image-20201115220150331


数据分析流程

image-20201115220216178

  1. R包安装
代码语言:javascript
复制
options("repos"="http://mirrors.ustc.edu.cn/CRAN/")
if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")

cran_packages <- c('tidyr',
                   'tibble',
                   'dplyr',
                   'stringr',
                   'ggplot2',
                   'ggpubr',
                   'factoextra',
                   'FactoMineR',
                   'devtools') 
Biocductor_packages <- c('GEOquery',
                         'hgu133plus2.db',
                         "KEGG.db",
                         "limma",
                         "impute",
                         "GSEABase",
                         "GSVA",
                         "clusterProfiler",
                         "org.Hs.eg.db",
                         "preprocessCore",
                         "hugene10sttranscriptcluster.db",
                         "enrichplot",
                         "ggplotify")

for (pkg in cran_packages){
  if (! require(pkg,character.only=T) ) {
    install.packages(pkg,ask = F,update = F)
    require(pkg,character.only=T) 
  }
}


for (pkg in Biocductor_packages){
  if (! require(pkg,character.only=T) ) {
    BiocManager::install(pkg,ask = F,update = F)
    require(pkg,character.only=T) 
  }
}

for (pkg in c(Biocductor_packages,cran_packages)){
  require(pkg,character.only=T) 
}
#没有error就是成功!
#有报错,安装报错包。如果你没有安装xx包,却提示你xx包不存在,这也正常,是因为复杂的依赖关系,缺啥补啥。
devtools::install_local("./AnnoProbe-master.zip",upgrade = F)#本地安装,去github下载。
library(AnnoProbe)
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-11-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 优雅R 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基本概念
  • 数据分析思路
  • 数据分析流程
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档