三阴性乳腺癌提取和分析

用户1359560

发布于 2020-08-13 15:23:23

8540

发布于 2020-08-13 15:23:23

文章被收录于专栏：生信小驿站生信小驿站

介绍

三阴性乳腺癌是指癌组织免疫组织化学检查结果为雌激素受体（ER）、孕激素受体（PR）和原癌基因Her-2均为阴性的乳腺癌。这类乳腺癌占所有乳腺癌病理类型的10.0%～20.8%，具有特殊的生物学行为和临床病理特征，预后较其他类型差。

临床表现

三阴性乳腺癌临床表现为一种侵袭性病程，其远处转移风险较高，内脏转移机会较骨转移高，脑转移几率也较高。三阴性乳腺癌的远处转移风险在3年时达到高峰，之后可能会有所下降。三阴性乳腺癌的中位肿瘤大小为2cm，50%有淋巴结转移。此类乳腺癌的组织学分级多为3级，细胞增殖比例较高。

治疗

目前还没有特有的针对三阴性乳腺癌的治疗指南。因此其治疗一般按乳腺癌常规标准治疗进行。

1.化疗

与其他类型乳腺癌相比，化疗对三阴性乳腺癌的有效率较高，但如果只是常规的标准治疗，其预后依然很差。

2.辅助化疗

FEC序贯多西他赛化疗有较好的反应。紫杉类药物对三阴性乳腺癌有一定的疗效。铂类药物在三阴性乳腺癌中可能更有效。顺铂新辅助化疗有相当疗效。

预后

本病预后仍较差，死亡风险较高。

##########################################################################################
## step1 load package and change Working Directory
###########################################################################################

library(TCGAbiolinks)
library(dplyr)
library(tidyr)
library(tibble)
library(edgeR)
library(limma)
rm(list=ls())
setwd('D:\\SCIwork\\F22\\brca')


##########################################################################################
## step2 download the expresssion data of lncRNA and mRNA
###########################################################################################


query <- GDCquery(project = "TCGA-BRCA", 
                  data.category = "Transcriptome Profiling", 
                  data.type = "Gene Expression Quantification", 
                  workflow.type = "HTSeq - Counts")


GDCdownload(query, method = "api", files.per.chunk = 50)

library(SummarizedExperiment)

expdat <- GDCprepare(query = query,   save = TRUE, save.filename = "exp.rda")

count_matrix = as.data.frame(assay(expdat))




##########################################################################################

###########################################################################################


rm(list=ls())

load('exp.rda')

count_matrix = as.data.frame(assay(data))

count_matrix[1:4,1:4]


# fpkmToTpm <- function(fpkm)
# {
#   exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
# }
# 
# 
# expr <- as.data.frame (apply(count_matrix  , 2, fpkmToTpm))
# 

expr <-  count_matrix %>% rownames_to_column("gene_id")



##########################################################################################

###########################################################################################





setwd("D:\\Originaldata\\GRCH\\Homo_sapiens.GRCh38.90")

load("gtf_df.Rda")

test <- gtf_df[1:5,]

View(test)


mRNA_exprSet <- gtf_df %>%
  dplyr::filter(type=="gene",gene_biotype=="protein_coding") %>%
  dplyr::select(c(gene_name,gene_id,gene_biotype)) %>%
  dplyr::inner_join(expr,by ="gene_id") %>%
  tidyr::unite(gene_id,gene_name,gene_id,gene_biotype,sep = " | ")


save(mRNA_exprSet,file = "mRNA_exprSet.Rda")


mRNA_exprSet <- mRNA_exprSet %>%
  tidyr::separate(gene_id, c("gene_name","gene_id","gene_biotype"),
                  sep = " \\| ")


mRNA_exprSet <- mRNA_exprSet[,-(2:3)]


index <- duplicated(mRNA_exprSet$gene_name)
mRNA_exprSet <- mRNA_exprSet[!index,]
row.names(mRNA_exprSet) <- mRNA_exprSet$gene_name
mRNA_exprSet$gene_name <- NULL


setwd('D:\\SCIwork\\F22\\brca')

save(mRNA_exprSet, file = "mRNA_exprSet.Rda")


##########################################################################################
## step1 load package and change Working Directory
###########################################################################################

library(TCGAbiolinks)
library(dplyr)
library(tidyr)
library(tibble)
library(edgeR)
library(limma)
rm(list=ls())
setwd('D:\\SCIwork\\F22\\brca')


query <- GDCquery(project = "TCGA-BRCA", 
                  data.category = "Clinical", 
                  file.type = "xml")
GDCdownload(query)

clinical <- GDCprepare_clinic(query, clinical.info = "patient")


#合并两类患者，得到肾透明细胞癌的临床信息
survival_data <- as.data.frame(clinical)

write.csv(survival_data , file = 'survival.csv')




##########################################################################################

###########################################################################################


options(stringsAsFactors = F)

library(stringr)

rm(list=ls())

setwd('D:\\SCIwork\\F22\\brca')

load( "mRNA_exprSet.Rda")


metadata <- data.frame(colnames(mRNA_exprSet))


for (i in 1:length(metadata[,1])) {
  num <- as.numeric(as.character(substring(metadata[i,1],14,15)))
  if (num == 1 ) {metadata[i,2] <- "T"}
  if (num != 1) {metadata[i,2] <- "N"}
}
names(metadata) <- c("id","group")
metadata$group <- as.factor(metadata$group)



metadata_T <- subset(metadata,metadata$group == "T")

metadata_T

metadata_N <- metadata[which(!(metadata$id %in% metadata_T$id)),]

metadata_N$group <- 'Control'

metadata_T$id1 <- substr(x= metadata_T$id, start = 1, stop = 12)



##########################################################################################

###########################################################################################


p <- read.csv('survival.csv',  header = T, sep = ',')

colnames(p)[grep("receptor_status", colnames(p))]
## [1] "breast_carcinoma_estrogen_receptor_status"               
## [2] "breast_carcinoma_progesterone_receptor_status"           
## [3] "lab_proc_her2_neu_immunohistochemistry_receptor_status"  
## [4] "metastatic_breast_carcinoma_estrogen_receptor_status"    
## [5] "metastatic_breast_carcinoma_progesterone_receptor_status"

# examining how many triple-negative receptors samples 
table(p$breast_carcinoma_estrogen_receptor_status == 'Negative' &
        p$breast_carcinoma_progesterone_receptor_status == 'Negative' &
        p$lab_proc_her2_neu_immunohistochemistry_receptor_status == 'Negative')

# extracting tnbc samples 
tnbc_samples <- p[p$breast_carcinoma_estrogen_receptor_status == 'Negative' &
                    p$breast_carcinoma_progesterone_receptor_status == 'Negative' &
                    p$lab_proc_her2_neu_immunohistochemistry_receptor_status == 'Negative', ]

tnbc_samples <- tnbc_samples$bcr_patient_barcode

metadata_TN <- metadata_T[which(metadata_T$id1 %in% tnbc_samples),]

metadata_TN$id1 <- NULL

metadata_TN$group <- 'TNBC'

metadata_TT <- metadata_T[which(!(metadata_T$id1 %in% tnbc_samples)),]

metadata_TT$id1 <- NULL

metadata_TT$group <- 'non-TNBC'

后续为个人数据自用，不便分享。

本文参与腾讯云自媒体分享计划，分享自作者个人站点/博客。

如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度