前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pan-cancer泛癌单基因分析问题之合并TCGA和GTEx

pan-cancer泛癌单基因分析问题之合并TCGA和GTEx

作者头像
用户1359560
发布2021-03-08 12:42:06
3.2K1
发布2021-03-08 12:42:06
举报
文章被收录于专栏:生信小驿站生信小驿站

这个学习记录总共分为两个部分。

(1)第一个部分是纯代码分析某个基因在TCGA33类肿瘤中的差异分析。 (2)结合TCGA和GTEx数据库,这样做的好处是:因为TCGA中肿瘤样本和正常样本是不均衡的,甚至某些肿瘤是没有癌旁正常组织的。所以结合GTEx数据库,可以大大增加正常样本的数量。

(1)TCGA差异分析

  • 下载TCGA rawcount数据。
代码语言:javascript
复制
#=======================================================


#=======================================================


library(GenomicDataCommons)

setwd('D:\\SCIwork\\F33\\TCGA')

rm(list=ls())


library(dplyr)

library(TCGAbiolinks)

library(dplyr)

library(DT)

library(SummarizedExperiment)

library(stringr)

#=======================================================


#=======================================================

cancer  <- TCGAbiolinks:::getGDCprojects()$project_id

cancer <- str_subset(cancer, "TCGA")

cancer <- sort(cancer)




for (i in 1:33) {
  cancer_select <- cancer[i]
  print(cancer_select)
  #下载rna-seq的counts数据
  suppressMessages({
    query <- GDCquery(
      project = cancer_select,
      data.category = "Transcriptome Profiling",
      data.type = "Gene Expression Quantification",
      workflow.type = "HTSeq - Counts")  })
  
  
  if (is.null(query)){
    print(paste0("No Counts data of solid normal tissue for ", cancer_select ))
  } else{
    
    GDCdownload(query, method = "api", 
                files.per.chunk = 300)
    expdat <- GDCprepare(query = query, save = TRUE,
                         save.filename = paste0(cancer_select,".rda"))
    count_matrix=assay(expdat)
    write.csv(count_matrix,
              file = paste( cancer_select,"Counts.csv",
                            sep = "-"))}}
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 这个学习记录总共分为两个部分。
  • (1)TCGA差异分析
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档