前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GEO芯片数据下载和在R语言的准备

GEO芯片数据下载和在R语言的准备

原创
作者头像
不会写代码的医学生
发布2024-03-15 14:33:46
960
发布2024-03-15 14:33:46
举报

差异基因分析思路

bing搜索GEO进入官网出现如下界面

数据集编号开头代表:

GPL 平台(platforms)

GSE 系列(series)

GSM 样本(samples)

点击Series进入搜索相关数据集,在Series type一栏

基因芯片表达矩阵就是探针表达矩阵,因为序列不变,基因会更新

基因表达芯片的原理:探针的表达量代表基因的表达量

#探针是根据截取的基因片段设计出来,与靶基因反向互补的核苷酸短序列

点array就是筛选芯片数据

进入一个系列,点击GPLxxxx(platforms)

需要ID 和Gene_symbol 这两列

在GSMxxx样本里看一下数据范围是否正常

ID_REF与VALUE value在0-24范围内正常(取过log)

芯片数据在Series Matrix Files里面

转录组和单细胞数据在Supplementary file

在R语言中的操作

准备工作

代码语言:r
复制
options("repos"="https://mirrors.ustc.edu.cn/CRAN/")
if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")

cran_packages <- c('tidyr',
                   'tibble',
                   'dplyr',
                   'stringr',
                   'ggplot2',
                   'ggpubr',
                   'factoextra',
                   'FactoMineR',
                   'devtools',
                   'cowplot',
                   'patchwork',
                   'basetheme',
                   'paletteer',
                   'AnnoProbe',
                   'ggthemes',
                   'VennDiagram',
                   'tinyarray') 
Biocductor_packages <- c('GEOquery',
                         'hgu133plus2.db',
                         'ggnewscale',
                         "limma",
                         "impute",
                         "GSEABase",
                         "GSVA",
                         "clusterProfiler",
                         "org.Hs.eg.db",
                         "preprocessCore",
                         "enrichplot")

for (pkg in cran_packages){
  if (! require(pkg,character.only=T,quietly = T) ) {
    install.packages(pkg,ask = F,update = F)
    require(pkg,character.only=T) 
  }
}


for (pkg in Biocductor_packages){
  if (! require(pkg,character.only=T,quietly = T) ) {
    BiocManager::install(pkg,ask = F,update = F)
    require(pkg,character.only=T) 
  }
}

#前面的所有提示和报错都先不要管。主要看这里
for (pkg in c(Biocductor_packages,cran_packages)){
  require(pkg,character.only=T) 
}
#没有任何提示就是成功了,如果有warning xx包不存在,用library检查一下。

#library报错,就单独安装。

引用自生信技能树

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 在R语言中的操作
    • 准备工作
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档