前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >三阴性乳腺癌提取和分析

三阴性乳腺癌提取和分析

作者头像
用户1359560
发布2020-08-13 15:23:23
8540
发布2020-08-13 15:23:23
举报
文章被收录于专栏:生信小驿站生信小驿站

介绍

三阴性乳腺癌是指癌组织免疫组织化学检查结果为雌激素受体(ER)、孕激素受体(PR)和原癌基因Her-2均为阴性的乳腺癌。这类乳腺癌占所有乳腺癌病理类型的10.0%~20.8%,具有特殊的生物学行为和临床病理特征,预后较其他类型差。

临床表现

三阴性乳腺癌临床表现为一种侵袭性病程,其远处转移风险较高,内脏转移机会较骨转移高,脑转移几率也较高。三阴性乳腺癌的远处转移风险在3年时达到高峰,之后可能会有所下降。三阴性乳腺癌的中位肿瘤大小为2cm,50%有淋巴结转移。此类乳腺癌的组织学分级多为3级,细胞增殖比例较高。

治疗

目前还没有特有的针对三阴性乳腺癌的治疗指南。因此其治疗一般按乳腺癌常规标准治疗进行。

1.化疗

与其他类型乳腺癌相比,化疗对三阴性乳腺癌的有效率较高,但如果只是常规的标准治疗,其预后依然很差。

2.辅助化疗

FEC序贯多西他赛化疗有较好的反应。紫杉类药物对三阴性乳腺癌有一定的疗效。铂类药物在三阴性乳腺癌中可能更有效。顺铂新辅助化疗有相当疗效。

预后

本病预后仍较差,死亡风险较高。

代码语言:javascript
复制
##########################################################################################
## step1 load package and change Working Directory
###########################################################################################

library(TCGAbiolinks)
library(dplyr)
library(tidyr)
library(tibble)
library(edgeR)
library(limma)
rm(list=ls())
setwd('D:\\SCIwork\\F22\\brca')


##########################################################################################
## step2 download the expresssion data of lncRNA and mRNA
###########################################################################################


query <- GDCquery(project = "TCGA-BRCA", 
                  data.category = "Transcriptome Profiling", 
                  data.type = "Gene Expression Quantification", 
                  workflow.type = "HTSeq - Counts")


GDCdownload(query, method = "api", files.per.chunk = 50)

library(SummarizedExperiment)

expdat <- GDCprepare(query = query,   save = TRUE, save.filename = "exp.rda")

count_matrix = as.data.frame(assay(expdat))




##########################################################################################

###########################################################################################


rm(list=ls())

load('exp.rda')

count_matrix = as.data.frame(assay(data))

count_matrix[1:4,1:4]


# fpkmToTpm <- function(fpkm)
# {
#   exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
# }
# 
# 
# expr <- as.data.frame (apply(count_matrix  , 2, fpkmToTpm))
# 

expr <-  count_matrix %>% rownames_to_column("gene_id")



##########################################################################################

###########################################################################################





setwd("D:\\Originaldata\\GRCH\\Homo_sapiens.GRCh38.90")

load("gtf_df.Rda")

test <- gtf_df[1:5,]

View(test)


mRNA_exprSet <- gtf_df %>%
  dplyr::filter(type=="gene",gene_biotype=="protein_coding") %>%
  dplyr::select(c(gene_name,gene_id,gene_biotype)) %>%
  dplyr::inner_join(expr,by ="gene_id") %>%
  tidyr::unite(gene_id,gene_name,gene_id,gene_biotype,sep = " | ")


save(mRNA_exprSet,file = "mRNA_exprSet.Rda")


mRNA_exprSet <- mRNA_exprSet %>%
  tidyr::separate(gene_id, c("gene_name","gene_id","gene_biotype"),
                  sep = " \\| ")


mRNA_exprSet <- mRNA_exprSet[,-(2:3)]


index <- duplicated(mRNA_exprSet$gene_name)
mRNA_exprSet <- mRNA_exprSet[!index,]
row.names(mRNA_exprSet) <- mRNA_exprSet$gene_name
mRNA_exprSet$gene_name <- NULL


setwd('D:\\SCIwork\\F22\\brca')

save(mRNA_exprSet, file = "mRNA_exprSet.Rda")


##########################################################################################
## step1 load package and change Working Directory
###########################################################################################

library(TCGAbiolinks)
library(dplyr)
library(tidyr)
library(tibble)
library(edgeR)
library(limma)
rm(list=ls())
setwd('D:\\SCIwork\\F22\\brca')


query <- GDCquery(project = "TCGA-BRCA", 
                  data.category = "Clinical", 
                  file.type = "xml")
GDCdownload(query)

clinical <- GDCprepare_clinic(query, clinical.info = "patient")


#合并两类患者,得到肾透明细胞癌的临床信息
survival_data <- as.data.frame(clinical)

write.csv(survival_data , file = 'survival.csv')




##########################################################################################

###########################################################################################


options(stringsAsFactors = F)

library(stringr)

rm(list=ls())

setwd('D:\\SCIwork\\F22\\brca')

load( "mRNA_exprSet.Rda")


metadata <- data.frame(colnames(mRNA_exprSet))


for (i in 1:length(metadata[,1])) {
  num <- as.numeric(as.character(substring(metadata[i,1],14,15)))
  if (num == 1 ) {metadata[i,2] <- "T"}
  if (num != 1) {metadata[i,2] <- "N"}
}
names(metadata) <- c("id","group")
metadata$group <- as.factor(metadata$group)



metadata_T <- subset(metadata,metadata$group == "T")

metadata_T

metadata_N <- metadata[which(!(metadata$id %in% metadata_T$id)),]

metadata_N$group <- 'Control'

metadata_T$id1 <- substr(x= metadata_T$id, start = 1, stop = 12)



##########################################################################################

###########################################################################################


p <- read.csv('survival.csv',  header = T, sep = ',')

colnames(p)[grep("receptor_status", colnames(p))]
## [1] "breast_carcinoma_estrogen_receptor_status"               
## [2] "breast_carcinoma_progesterone_receptor_status"           
## [3] "lab_proc_her2_neu_immunohistochemistry_receptor_status"  
## [4] "metastatic_breast_carcinoma_estrogen_receptor_status"    
## [5] "metastatic_breast_carcinoma_progesterone_receptor_status"

# examining how many triple-negative receptors samples 
table(p$breast_carcinoma_estrogen_receptor_status == 'Negative' &
        p$breast_carcinoma_progesterone_receptor_status == 'Negative' &
        p$lab_proc_her2_neu_immunohistochemistry_receptor_status == 'Negative')

# extracting tnbc samples 
tnbc_samples <- p[p$breast_carcinoma_estrogen_receptor_status == 'Negative' &
                    p$breast_carcinoma_progesterone_receptor_status == 'Negative' &
                    p$lab_proc_her2_neu_immunohistochemistry_receptor_status == 'Negative', ]

tnbc_samples <- tnbc_samples$bcr_patient_barcode

metadata_TN <- metadata_T[which(metadata_T$id1 %in% tnbc_samples),]

metadata_TN$id1 <- NULL

metadata_TN$group <- 'TNBC'

metadata_TT <- metadata_T[which(!(metadata_T$id1 %in% tnbc_samples)),]

metadata_TT$id1 <- NULL

metadata_TT$group <- 'non-TNBC'

后续为个人数据自用,不便分享。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 介绍
  • 临床表现
    • 治疗
      • 预后
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档