下面是《GEO数据挖掘课程》的配套笔记(第二篇)
GEO
和TCGA
NCBI
, ENSEMBL
, UCSC
对文献解读的第三篇文章==Identification of Key Genes and Pathways in Triple-Negative Breast Cancer by Integrated Bioinformatics Analysis== 的分析过程进行重复
找到GSE号进如GEO数据库
进入GEO并搜索数据集点击目标查询进入目标数据集网页
下载数据的详细介绍
探针注释平台的位置
表达矩阵下载位置表达矩阵下载的方式:
表达矩阵下载的方法一
表达矩阵下载方式二
GEOquery
R 程序包从GEO数据库下载
==Note==:使用下面的代码下载的文件都会保存到本地,destdir
参数指定数据存放的位置。此外,比较重要的三个参数为GSEMatrix=TRUE,AnnotGPL=FALSE, getGPL=TRUE
#加载程序包
library(GEOquery)
#根据GDS下载soft文件
gds <- getGEO('GD858', destdir='.')
#根据GPL号下载芯片设计信息
gpl96 <- getGEO("GPL96", destdir=".")
#根据GSE号下载series_matrix.txt.gz
gse1009 <- getGEO("GSE1009",dstdir=".")
GSE76275.Rproj
视频观看方式
我把3年前的收费视频课程:3年前的GEO数据挖掘课程你可以听3小时或者3天甚至3个月,免费到B站:
然后马上就有了3千多学习量,而且有学员给出来了图文并茂版本万字笔记,让我非常感动!