前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >oncoPredict:一个用于预测体内或癌症患者药物反应和细胞系筛查数据的生物标志物的R包

oncoPredict:一个用于预测体内或癌症患者药物反应和细胞系筛查数据的生物标志物的R包

作者头像
DoubleHelix
发布2023-09-06 10:03:45
1.7K0
发布2023-09-06 10:03:45
举报
文章被收录于专栏:生物信息云

Cancer Therapeutics Response Portal (CTRP)

目前主要是CTRP v2,官网是:http://portals.broadinstitute.org/ctrp.v2.1/

  • 481 化合物 X 860 细胞系
  • 与拷贝数和基因表达数据的相关性
  • mutation data integrate CCLE and Sanger/MGH calls
  • correlation and enrichment analysis on-the-fly
  • box-whisker visualization in addition to enrichment heatmaps
  • drill-down to scatter plots and concentration-response curves
  • flter by lineage/subtype, growth mode
  • Genomics of Drug Sensitivity in Cancer (GDSC)

如果是v2的版本,有805种细胞系以及 198种化合物

如果是看v1版本,987种 和 367种化合物

官网是:https://www.cancerrxgene.org/

我们这里直接使用R包oncoPredict整理好的这两个数据库的rdata文件,下载链接是:https://osf.io/c6tfx/files/osfstorage

CTRP数据库里面的细胞系表达量矩阵是来自于转录组测序, 所以提供了 FPKM和TPM两个版本供用户选择。GDSC数据库里面的细胞系表达量矩阵应该是芯片,因为它使用了RMA Normalized and Log Transformed ,标准的芯片数据处理方法。

读入GDSC表达数据

代码语言:javascript
复制
dir = 'E:/DatabaseData/Drug/OSF/Training Data'
GDSC2_Expr = readRDS(file = file.path(dir,'GDSC2_Expr (RMA Normalized and Log Transformed).rds'))
dim(GDSC2_Expr)
head(GDSC2_Expr)[,1:4]

读入药物的IC50数据:

代码语言:javascript
复制
GDSC2_Res = readRDS(file = file.path(dir,"GDSC2_Res.rds"))
dim(GDSC2_Res)
head(GDSC2_Res)[,1:4]

列名是药物名称,只不过加了一个编号。行名就是细胞。

代码语言:javascript
复制
GDSC2_Res <- exp(GDSC2_Res)

然后就可以参照前面我们介绍的基于CellMiner数据库的基因表达与药敏分析,进行探索基因表达与药物敏感之间的相关性了。我们这里重点介绍oncoPredict包的药物预测。

首先,我们需要有一个自己的表达数据。

代码语言:javascript
复制
testExpr <- GDSC2_Expr[,sample(1:ncol(GDSC2_Expr),20)]
head(testExpr[,1:4] ) 
colnames(testExpr)=paste0('test',colnames(testExpr))
dim(testExpr)

然后我们用GDSC的表达量矩阵和药物处理信息作为训练数据,这些数据交给R包 oncoPredict种的calcPhenotype函数就可以了,超级简单!

代码语言:javascript
复制
# install.packages("oncoPredict")
library(oncoPredict)
calcPhenotype(trainingExprData = GDSC2_Expr,
              trainingPtype = GDSC2_Res,
              testExprData = testExpr,
              batchCorrect = 'eb',  #   "eb" for ComBat  
              powerTransformPhenotype = TRUE,
              removeLowVaryingGenes = 0.2,
              minNumSamples = 10, 
              printOutput = TRUE, 
              removeLowVaringGenesFrom = 'rawData')
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档