前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >生物信息数据分析教程视频——08-TCGA+GTEx数据库的数据整理

生物信息数据分析教程视频——08-TCGA+GTEx数据库的数据整理

作者头像
DoubleHelix
发布2022-12-15 15:33:42
9331
发布2022-12-15 15:33:42
举报
文章被收录于专栏:生物信息云生物信息云

视频地址:http://mpvideo.qpic.cn/0b2efmaamaaaryalyzztmvrvak6dayvqabqa.f10002.mp4?

参考文章:

UCSC数据库下载TCGA数据需要注意的细节

我要研究的癌症在TCGA数据库没有正常样本或正常样本数少怎么办?

案例代码:

代码语言:javascript
复制
##数据下载地址
#https://xenabrowser.net/datapages/?cohort=TCGA%20TARGET%20GTEx&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443

###=====================处理标准化后的===========
library(data.table)
library(dplyr)
data = fread("./TcgaTargetGtex_RSEM_Hugo_norm_count.gz",
             data.table = F)
head(data)[,1:3]
colnames(data)[1] = "symbol"

info = fread("./TCGA_GTEX_category.txt")
sam_info = table(info$TCGA_GTEX_main_category) %>% as.data.frame()

GTEX_Lung_sample = info$sample[info$TCGA_GTEX_main_category == "GTEX Lung"]
TCGA_LUAD_sample = info$sample[info$TCGA_GTEX_main_category == "TCGA Lung Adenocarcinoma"]
# TCGA_LUSC_sample = info$sample[info$TCGA_GTEX_main_category == "TCGA Lung Squamous Cell Carcinoma"]

#这里来自TCGA数据库中的样本已经不包含癌旁组织了!
TCGA_LUAD_GTEx = data %>% dplyr::select(symbol,all_of(c(GTEX_Lung_sample,TCGA_LUAD_sample)))
TCGA_LUAD_GTEx[1:10,1:3]

rownames(TCGA_LUAD_GTEx) <- TCGA_LUAD_GTEx[,1]
TCGA_LUAD_GTEx <- arrange(TCGA_LUAD_GTEx,symbol)
TCGA_LUAD_GTEx <- TCGA_LUAD_GTEx[,-1]

save(TCGA_LUAD_GTEx,file = "TCGA_LUAD_GTEx.Rdata")
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档