只需要3行代码就可以搞定的,下载后的数据解压到了DLBC_SNV文件夹中。
library(maftools)
library(tidyverse)
mafFilePath = dir(path = "./DLBC_SNV/",pattern = "masked.maf.gz$",full.names = T,recursive=T)
mafdata <- lapply(mafFilePath, function(x){read.maf(x,isTCGA=TRUE)})
snv_data = merge_mafs(mafdata)
得到的数据对象和之前的处理方式是一样的。
也可以计算TMB和MATH
肿瘤突变负荷(TMB)与等位基因突变的肿瘤异质性(MATH)分数的计算
如果你有老版本的数据也是可以用的,不一定要更新。
当然,TCGAbiolinks包还是可以下载的,但仅仅是可以下载数据而已,不过下载速度有些慢。希望开发该包的作者更新一下这个包。
library(TCGAbiolinks)
query_SNV <- GDCquery(project = "TCGA-DLBC",
data.category = "Simple Nucleotide Variation",
data.type = "Masked Somatic Mutation",
workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking")
GDCdownload(query_SNV)
mafFilePath2 = dir(path = "GDCdata/TCGA-DLBC",pattern = "masked.maf.gz$",full.names = T,recursive=T)
mafdata2 <- lapply(mafFilePath2, function(x){read.maf(x,isTCGA=TRUE)})
snv_data2 = merge_mafs(mafdata2)
本文分享自 MedBioInfoCloud 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!