前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2022-TCGA数据库重大更新后3行代码提取simple nucleotide variation的数据

2022-TCGA数据库重大更新后3行代码提取simple nucleotide variation的数据

作者头像
DoubleHelix
发布2022-04-18 15:11:36
4.5K8
发布2022-04-18 15:11:36
举报
文章被收录于专栏:生物信息云生物信息云
最近,TCGA数据库发生重大更新,前面我介绍了RNAseq的处理后【2022-TCGA

只需要3行代码就可以搞定的,下载后的数据解压到了DLBC_SNV文件夹中。

代码语言:javascript
复制
library(maftools)
library(tidyverse)
mafFilePath = dir(path = "./DLBC_SNV/",pattern = "masked.maf.gz$",full.names = T,recursive=T)
mafdata <- lapply(mafFilePath, function(x){read.maf(x,isTCGA=TRUE)})
snv_data = merge_mafs(mafdata)

得到的数据对象和之前的处理方式是一样的。

TCGA数据库:SNP数据的下载整理及其可视化

也可以计算TMB和MATH

肿瘤突变负荷(TMB)与等位基因突变的肿瘤异质性(MATH)分数的计算

如果你有老版本的数据也是可以用的,不一定要更新。

当然,TCGAbiolinks包还是可以下载的,但仅仅是可以下载数据而已,不过下载速度有些慢。希望开发该包的作者更新一下这个包。

代码语言:javascript
复制
library(TCGAbiolinks)
query_SNV <- GDCquery(project = "TCGA-DLBC",
                      data.category = "Simple Nucleotide Variation",
                      data.type = "Masked Somatic Mutation",
                      workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking")
GDCdownload(query_SNV)

mafFilePath2 = dir(path = "GDCdata/TCGA-DLBC",pattern = "masked.maf.gz$",full.names = T,recursive=T)
mafdata2 <- lapply(mafFilePath2, function(x){read.maf(x,isTCGA=TRUE)})
snv_data2 = merge_mafs(mafdata2)
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档