前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >生物信息数据分析教程视频——16-单样本基因集富集分析(ssGSEA)用于肿瘤相关免疫细胞浸润水平评估

生物信息数据分析教程视频——16-单样本基因集富集分析(ssGSEA)用于肿瘤相关免疫细胞浸润水平评估

作者头像
DoubleHelix
发布2022-12-16 18:48:22
7590
发布2022-12-16 18:48:22
举报
文章被收录于专栏:生物信息云生物信息云

R基础:生信分析的R语言基础教程都在这里了,包括语法,绘图和数据分析。

生物信息数据分析教程视频——01-TCGA数据库RNAseq数据下载与整理

生物信息数据分析教程视频——02-TCGA数据库miRNA数据下载与整理

生物信息数据分析教程视频——03-有关TCGA数据库临床数据的问题

生物信息数据分析教程视频——04-TCGA数据库中SNV和CNV数据的下载

生物信息数据分析教程视频——05-TCGA数据库中甲基化数据的下载和整理

生物信息数据分析教程视频——06-GEO数据库中芯片数据的下载和整理

生物信息数据分析教程视频——07-TCGA数据库:基因的表达探索

生物信息数据分析教程视频——08-TCGA+GTEx数据库的数据整理

生物信息数据分析教程视频——09-TCGA+GTEx数据库联合表达分析

生物信息数据分析教程视频——10-TCGA数据库:miRNA的表达探索

生物信息数据分析教程视频——11-筛选相关性基因

生物信息数据分析教程视频——12-基因之间的相关性分析及可视化

生物信息数据分析教程视频——13-3种R包(DESeq2、edgeR和limma)进行RNAseq的差异表达分析与比较

生物信息数据分析教程视频——14-芯片数据的表达差异分析

生物信息数据分析教程视频——15-clusterProfiler包+ClueGO做富集分析

http://mpvideo.qpic.cn/0bc3pmacoaaaduaeldb56frva66de55qajya.f10002.mp4?dis_k=b1b46d5ac890ebc474c82c14693543bb&dis_t=1671187659&vid=wxv_2606759925549268992&format_id=10002&support_redirect=0&mmversion=false


代码:

代码语言:javascript
复制
# setwd("H:/MedBioInfoCloud/analysis/TCGA/new/conventionalAnalysis")
options(stringsAsFactors = F)
library(TCGAbiolinks)
library(GSVA)
library(GSEABase)
FilePath <- dir("H:/MedBioInfoCloud/analysis/TCGA/new/processedTCGAdata/TCGA-STAR_Exp/",
                "STARdata.Rdata$",full.names = T)

opt <- "output/009-CellFractions/ssGSEA/"
ifelse(dir.exists(opt),FALSE,dir.create(opt,recursive = T))

source("H:/MedBioInfoCloud/analysis/TCGA/new/00-fun/filterGeneTypeExpr.R")
source("H:/MedBioInfoCloud/analysis/TCGA/new/00-fun/del_dup_sample.R")


###TCGA数据库中33中癌症类型
project <- getGDCprojects()$project_id
project <- project[grep("TCGA-",project)]
# proj = "TCGA-LUAD"

immune_cell_geneSet = getGmt("H:/MedBioInfoCloud/analysis/base_files/immue_BG_GeneSet/ssGSEA_immue_BG_GeneSet.gmt",
                             geneIdType=SymbolIdentifier())

# devtools::install_github("BioInfoCloud/csGeneset")
# library(csGeneset)
# gsImmCell <- gsGSVA[["ImmCell"]][["geneSet"]]
# proj = "TCGA-LUAD"

for(proj in project){
  message("===============================")
  message(proj)
  load(FilePath[grep(proj,FilePath)])#STARdata
  tpm <- STARdata[["tpm"]]
  tpm <- filterGeneTypeExpr(expr = tpm,
                            fil_col = "gene_type",
                            filter = FALSE)
  ##过滤不表达的基因
  tpm <- tpm[apply(tpm,1,var) !=0,]
  ##正常组织样本ID
  SamN <- TCGAquery_SampleTypes(barcode = colnames(tpm),
                                typesample = c("NT","NB","NBC","NEBV","NBM"))
  
  ##肿瘤组织样本ID
  SamT <- setdiff(colnames(tpm),SamN)
  
  ###去除重复样本
  tur_exp <- del_dup_sample(tpm[,SamT],col_rename = T)
  # ###long2转换
  # tur_exp <- log2(tur_exp + 1)
  ssGSEA_Score = gsva(as.matrix(tur_exp), 
                      immune_cell_geneSet,
                      method='ssgsea',
                      kcdf='Gaussian',
                      abs.ranking=TRUE)#ssGSEA计算
  normalize=function(x){
    return((x-min(x))/(max(x)-min(x)))}#定义ssGSEA_Score矫正函数
  
  norm_ssGSEA_Score <- normalize(ssGSEA_Score)#对ssGSEA_Score进行矫正
 
  file <- paste0(opt,proj,"-normalize_turmor_ssGSEA_Score.txt")
  write.table(norm_ssGSEA_Score,file = file,sep="\t",quote=F,col.names=F)#此处的输出文件即为ssGSEA富集得分文件
}
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-10-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档