前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【高分新文】Cancer Cell|肿瘤细胞系中临床相关蛋白的药物响应特征

【高分新文】Cancer Cell|肿瘤细胞系中临床相关蛋白的药物响应特征

作者头像
作图丫
发布2022-03-29 11:40:02
1.1K0
发布2022-03-29 11:40:02
举报
文章被收录于专栏:作图丫

Large-Scale Characterization of Drug Responses of Clinically Relevant Proteins in Cancer Cell Lines

2020.10.28

IF:26.602

导语

GUIDE ╲

癌症是一种高度异质性的疾病,包括许多组织类型和不同的致癌驱动因素,在不同的肿瘤背景下,治疗反应常常是不同的。

背景介绍

在过去的十年中,人们在分子水平上对人类癌症的巨大异质性进行了广泛的研究。然而,癌症研究的一个真正挑战是,获得对癌症细胞行为背后的因果关系和机制的系统理解,最终目标是改善患者的预后。为了解决这一难题,扰动(perturbation)实验提供了一种强有力的方法,多次扰动细胞,并监视扰动后产生的下游结果。因此获得的纵向数据在基础生物网络线程及其在压力下的相关变化方面提供了相当多的信息,从而导致对细胞在压力下生存机制的更深层次的理解。近年来,已建立了扰动癌细胞系的表型和细胞效应的大规模概要。例如,已经发表了大规模的药物扰动研究,对多种细胞系不同药物治疗的细胞活力测量;一些研究已经利用loss-of-function小干扰RNA(siRNA)、短发夹RNA(shRNA)或CRISPR-Cas9 screens在大量细胞系中建立了全基因组的“癌症依赖图谱”;使用高效、稳健的RNA测量平台L1000,已经开发出一种癌细胞对不同扰动的mRNA反应的“connectivity map”。这些研究为了解癌症的机制和表型提供了有价值的资源。然而,尚未建立用于分析和整合扰动癌细胞系蛋白响应的类似大规模资源。考虑到蛋白质构成了生物过程中的基本功能单位,并且代表了癌症治疗的主要靶点,这种认知上的差距就更令人吃惊了。

为了填补这一空白,该工作使用反相蛋白阵列(RPPAs)生成并编辑了一个大的肿瘤细胞系对多种临床相关药物响应的的扰动蛋白表达谱。RPPA是一种基于抗体的定量方法,以高通量、低成本、敏感的方式在大量样本中评估蛋白质markers。这个平台依靠抗体来检测蛋白质,目前,只有有限的但快速增长的蛋白质有高质量的抗体存在,可分析的信号。该工作已经应用该技术来量化大量患者群(如TCGA)和癌细胞系的蛋白表达水平(如CCLE)。目前的抗体库包括PI3K/AKT、RAS/MAPK、Src/FAK、TGF-b/SMAD、JAK/STAT、DNA损伤修复、Hippo、细胞周期、细胞凋亡、组蛋白修饰和免疫肿瘤等关键的致癌通路。最近的研究已经证明了基于RPPA的适应性反应在组合疗法的合理设计中的价值,其中一些应用于临床对患者有益。

数据介绍

1. CCLE的质谱定量数据,即蛋白质表达

2. GEO数据GSE92742获取L1000 基因表达数据

3. CTRPv2、GDSC和Daemen et al. (2013)的药物敏感性数据

4. STRING的蛋白质互作数据

5. 本工作生成的RPPA数据可在CPPA data portal获取

方法介绍

1.RPPA数据处理

使用R包SuperCurve对RPPA采用质量控制分类器对RPPA slide质量进行评估,在curated RPPA数据集中使用广义线性模型和逻辑函数进行训练。只有质量score大于0.8的slides保留下来进行后面的分析。总共从15842个样本中获得了RPPA数据,包括12183个处理过的细胞系样本和3659个baseline样本(即 DSMO)。

2. RPPA平台进行质量评估

首先对baseline样本进行RPPA数据评估。检查相同细胞系baseline样本中RPPA信号的一致性,排除与其他baseline样本的平均相关性系数<0.5的样本。然后对post-treatment样本进行质量评估。对于每一对post-treatment重复样本,使用通过上述一致性检验的相应的baseline样本生成蛋白质响应(protein response,Dp)谱,并将重复样本(2753对)的Dp进行比较。移除低Pearson相关性的低样本对。最后保留11884个post-treatment和3608个 baseline通过内部质量评估的样本。对于每个treated样本,通过在相应的control样本中扣除相应蛋白水平来计算每个蛋白的Dp。当可获得重复(技术或生物学),使用重复样本的均值。通过比较重复样本,生成1916个unique baseline蛋白谱和7941个unique post-treatment蛋白响应谱。对于一个细胞系中特定的处理,生成time-independent Dp谱,合并不同时间点蛋白响应的均值。

3.使用独立平台进行质量评估

获取CCLE标化后的蛋白表达数据,对于每个有R8细胞系重叠蛋白质组数据集的baseline RPPA数据集,计算共同的细胞系的标化后的表达值的Spearman相关系数,分析中总共包括169 unique蛋白质。通过计算同一细胞系同一组中每对不同蛋白质之间的Spearman相关系数,建立相关性的背景分布。

从GEO数据库(GSE92742)下载了L1000阶段1的level-5数据。为了进行公平的比较,收集了受同一药物扰动的相同细胞系的数据。在随后的分析中,使用了两个平台共有的46个“perturbation-cell-line”IDs(60个样本)和347个基因/蛋白。对于具有多个浓度和/或时间点的perturbation-cell-line ID,采用所有条件下的中值作为代表性响应分数。对于每个平台,首先将连续响应转换为分类响应:上调、下调或中性。然后由整个矩阵计算,全局中位数±35%分位数为随机事件。接下来,排除了随机事件并计算Goodman-Kruskal’s γ (ɣ)来估计不同基因之间的样本关联。

通过两项分析评估了RPPA和L1000平台之间的一致性:(1)蛋白-mRNA响应关联:当有至少12个基因显示上调/下调时,计算两个平台之间的ɣ关联性。通过随机重组蛋白标签并计算重组蛋白与mRNAs之间的响应关联来生成背景分布。然后,使用配对的Student’s t-test来评估真实和随机匹配之间的差异;(2)样本-样本关联:在本工作产生的RPPA数据集,一个perturbation-cell-line ID可能有复制样本。只保留了之前分析中蛋白-mRNA反应相关性最好的那一个。接下来,显示上调/下调大于3个基因的样本,在每个平台里计算每两个样本间的ɣ关联性。然后,使用Pearson’s相关性分析计算显著ɣ关联性,来评估蛋白质和mRNA响应之间的一致性。

4.预测蛋白markers的药物敏感性分析

使用药物敏感性数据,对于 MCF7分析,基于AUCs计算所有筛选细胞系中每种药物的AUC Z-scores。计算了扰动通路scores的中值。用非配对Student’s t-test评估特定药物组与其他药物的AUC差异,FDR < 0.01为显著药物组。

为了识别药物敏感和耐药的差异蛋白markers,根据CTRPv2、GDSC2和数据集,将细胞系划分为对特定药物敏感或耐药Student’s t-test识别在敏感细胞系和耐药细胞系之间Baseline水平(p0)和蛋白响应水平(Dp)的显著差异。在Pathway-level scores(Li et al.,2017)也进行了相似分析。

为了评估扰动RPPA数据对不同细胞系的预测能力,使用相同细胞系使用相同药物在不同剂量或不同时间点处理的扰动数据均值。单因素分析中,7个化合物有RPPA扰动谱和药物敏感性数据。对于每个药物,检测每个抗体的p0和Dp与药物敏感性(IC50或AUC评分)的相关性。然后,开发了一个多变量模型来预测药物敏感性,使用单点leave-one-out和三组蛋白谱:p0、p1和联合水平(p0和p1)。然后基于机器学习分析,为了特征选择和交叉验证具有足够的统计能力,在R10细胞系中检测了含有RPPA扰动数据和药物敏感性数据的化合物。只有lapatinib(n = 13个细胞系)和GSK690693(n = 10个细胞系)能够产生统计意义上的评估模型。在训练集中,首先选择candidate markers,在p = 0.1显著性水平下进行单变量相关检验,最大markers量为20个。在时间序列实验中,使用上述三组蛋白质图谱对每个时间点进行交叉验证。在验证中使用预测的均方误差(MSE)来评估性能。

5. 构建药物-蛋白Connectivity Map

通过细胞系配对t检验,检验p0与p1蛋白表达差异,评估各药物-蛋白对的相关性。对于每一组药物对,使用Goodman-Kruskal’s ɣ计算关联性。使用显著相关的药物-蛋白和药物-药物(FDR < 0.1)构建全局药物-蛋白连通性图(global drug-protein connectivity map)。对于每种药物,计算RPPA蛋白的两个亚组的网络密度:(1)p0和p1之间差异表达显著(perturbed RPPA 蛋白)(2)其他RPPA蛋白。

蛋白-蛋白相互作用数据来自STRING数据库。定义一组蛋白数量为N的网络的密度D为蛋白质-蛋白质相互作用的数量(E)与所有可能的蛋白质对数量的比值(Emax = N2)。使用配对Wilcoxon检验评估所有药物的扰动蛋白和其他蛋白之间网络密度的差异。

6.药物组合的预测和验证

首先从完整的connectivity map中提取以每个以药物为中心的(drug-centered)connectivity map(图6)。将扰动蛋白markers按其相关的蛋白通路进行分组。baseline和扰动通路评分分别基于baseline(从CCLE获得)和扰动蛋白水平的加权平均值计算。使用扰动通路评分来推断对每种药物的通路反应。使用baseline通路评分对通路与药敏数据进行相关性分析,进而推断耐药通路。针对耐药通路,当发现(1)AUC与下调通路或存在正相关,或(2)AUC与上调通路或存在负相关时,预测药物为候选组合。基于相关性系数排秩,选出每种药物的top 10组合。从PubMed和clinical trial database获取文献和临床证据。CTRPv2获取MK-2206 (AKTi)和 selumetinib (MEKi)极其组合的敏感性数据(AUC)。

结果解析

01

构建一个大规模的高质量的癌症细胞系扰动RPPA

首先测量癌症细胞系对170中预临床和临床治疗(通常包括多个时间点)的RPPA-based蛋白质表达谱,生成高质量的扰动蛋白响应数据,包括baseline治疗前p0和治疗后p1水平标化后的RPPA数据和蛋白响应扰动数据(图1A)。该工作开发了一个多级、多平台质量控制(QC)的方法,首先评估baseline和蛋白质响应谱的再现性,然后使用独立平台验证数据的可复制性(图1B)。通过比较复制样本和随机样本对的Dp相关性,发现复制样本在蛋白markers之间的相关性高于随机样本(图1C和1D),说明RPPA数据具有较高的可重复性。排除2.2%的低置信度样本后,最终保留15492个样本(11884个药物处理样本和3608个对照样本,与在319个细胞系中168种药物扰动相关)的质控后的RPPA profiles(210个total和磷酸化蛋白markers)。

该工作的数据集中的癌细胞系来自乳房、卵巢等几种组织,药物靶向癌症相关过程,包括PI3K/mTOR信号、ERK/MAPK信号、RTK信号、EGFR信号、TP53通路、基因组完整性、细胞周期、抗精神病药物和染色质重塑(图1E)。由于时间和成本的限制和不同药物的临床相关性,该工作不是分析在所有细胞系和药物组合上的所有可能的扰动,而是采用了一种更加实际的方法,一些细胞系和药物组之前分析的频率比较高,但对依旧对其进行更广泛的药物扰动分析(图1E)。该工作的样本集高度富集于公共资源中具有丰富分子谱和药物反应数据的常见的、特征良好的癌细胞系子集。对于许多治疗靶点,分析了多种靶向制剂,包括针对同一通路的不同成员的药物,目的是提高识别on-target活性的能力。

由于在同一平台上的高重复性并不一定意味着有效性,为了进一步确认RPPA数据输出的质量,接下来使用独立平台验证的蛋白响应数据(图1B)。首先,将RPPA平台中的baseline蛋白表达与一组共享细胞系中的 baseline质谱数据进行了比较(图2A)。发现两个蛋白质组平台之间的对应蛋白对在细胞系间的相关性比随机蛋白对高得多(图2B)。其次,由于缺乏蛋白质对药物治疗反应的广泛数据,使用了来自connectivity map的mRNA反应数据。由于该分析针对的是不同的分子(蛋白质vs RNA),并且是跨不同平台的(RPPA vs . L1000),因此采用了Goodman-Kruskal’s ɣ相关性来进行稳健的评估。基于受相同化合物扰动的相同细胞系(n = 46 unique细胞系-药物扰动),将原始连续反应分数转换为分类反应组(上调,中性和下调),然后通过计算mRNA -蛋白响应关联性和样本-样本关联性,比较mRNA-蛋白响应一致性(图2C)。在相同条件下匹配的mRNA-蛋白响应高度相关,显著高于随机背景分布(图2D)。接下来检验是否基于RPPA蛋白响应数据推断出的样本-样本关联性能够在基于L1000 mRNA响应数据推断的中保留下来发现在任何一个平台发现的显著的样本-样本关联中,基于RPPA的 ɣ得分与基于L1000的ɣ得分表现出强烈的正相关(图2E)。此外,基于RPPA的分类关联与基于L1000的关联高度一致。这些使用跨分子、跨平台和交叉研究比较的外部验证有力地支持了该工作的蛋白质响应数据的整体高质量

02

通过蛋白质响应对药物敏感性进行机制分析

为了评估蛋白响应数据是否能对药物治疗的表型后果提供有意义的见解,关注了乳腺癌细胞系MCF7,这是数据集中处理样本最多的乳腺癌细胞系,进行深入分析。首先从> 1500个MCF7样本中提取RPPA数据。总的来说,这些样本在多个时间点被19个化合物或组合、9个刺激物和DMSO处理,包括了MCF7的主要药物靶点,包括雌激素受体(ER)、PI3K/mTOR、AKT、MEK和EGFR。为了阐明不同药物反应的信号通路,进一步从两个维度总结了Dp数据,通过(1)将蛋白分组为主要的癌症功能通路(如PI3K/AKT、RAS/MAPK和TSC/mTOR),以及(2)根据其靶通路对化合物进行分类(如ER、PI3K/mTOR和AKT)。然后使用CTRPv2的MCF7的药物敏感性中值对各药物组进行排序,发现MCF7对8个药物组中的2个明显更敏感(图3A)。使用另一个大规模药物敏感性数据资源GDSC2证实了同样的模式。MCF7是一种ER阳性的乳腺癌细胞系,对ER抑制剂表现出最高的敏感性,其次是PI3K/mTOR抑制剂。接下来使用D通路评分(Akbani et al., 2014)的中位数来表示每个药物组的平均通路反应,发现这两个药物组表现出最显著的通路反应(图3B)。进一步比较了每种通路的敏感药物组(ER和PI3K/mTOR)和其他组,发现了几种不同的反应通路(图3C, 3D)。具体来说,三个通路抑制敏感组(如,TSC / mTOR、PI3K / AKT和细胞周期)和敏感组中的三个通路的D通路评分要比其他药物(包括凋亡、RTK和RAS / MAPK)的高。这些观察结果不仅表明基于RPPA的蛋白质响应数据成功地捕获了药物治疗的重要表型效应,而且也表明了揭示药物敏感性的分子机制的能力。

为了进一步说明蛋白响应如何有助于阐明药物反应机制,重点分析了不同细胞系的MEK抑制剂(MEKis),以cobimetinib为例,同时考虑p0和Dp(图4)。首先基于CTRPv2和 GDSC2的药物反应数据,将细胞系分成MEKi耐药组和敏感组。与预期的一样,RAS/MAPK通路异常的细胞系更倾向于RAS/MAPK baseline通路活性和对MEKi的敏感性,表现为BIM低、EGFR等高(图4A)。

cobimetinib诱导的RAS/MAPK通路活性下降与cobimetinib敏感性关联,同时发现细胞周期进展下降,应该是RAS/MAPK信号通路抑制的结果(图2B)。同时有转换成上皮性的markers,即EMA、β-catenin等增加(图4B)。在pre-treatment样本里,识别到多个与cobimetinib敏感性的关联,在cobimetinib-treated样本里这些关联性加重。然后通过聚集通路中蛋白改变计算了pathway-level响应,发现adaptive 通路评分改变与敏感细胞系中诱导细胞周期抑制药物敏感性和耐药细胞系中PI3K/AKT信号激活相关(图4C)。结果说明(1)RAS/MAPK通路抑制剂敏感性与baseline通路活性和细胞状态相关 (2)耐药细胞系中MEKi的获得性耐药或许来源于PI3K/AKT通路的适应性激活

03

增加通过蛋白质响应来预测药物敏感性的预测效能

该团队之前的工作说明了基于RPPA baseline蛋白水平对癌细胞系的药物敏感性有预测效能。接下来对这个理论进行了两个补充分析来进一步评估这个预测效能。首先,基于个体蛋白质,评估了扰动RPPA数据与药物的敏感性的关联性。整合了该工作的RPPA数据和GDSC2的药物敏感性数据,识别到有7个药物有至少5个不同细胞系的敏感性数据和蛋白表达数据,然后对于每个药物,识别三类与药物敏感性相关的蛋白markers:(1)p0:在细胞系中,蛋白的baseline水平显示与药物敏感性有显著的相关性(2)只Dp:蛋白响应与药物敏感性显著相关 (3)Dp和p0:在预测药物敏感性上,蛋白响应显示另外的信息背景。对于所有的7种药物,Dp-informative (Dp only + Dp|p0) 蛋白markers的数量比p0-based markers显著高(图5A)。

其次,下面的研究主要集中于两种药物,lapatinib和GSK690693,它们至少在10个不同细胞系中有RPPA蛋白何药物敏感性数据,为了评估所有蛋白markers对药物敏感性的整体预测表现,使用了一个比较严格的机器学习方法。对于每个药物,有7个治疗后的时间点的RPPA蛋白数据(图5B-E)。为了比较,使用弹性网络方法基于三组蛋白markers开发了预测模型:(1)p0, baseline水平(2)p1, post-treatment水平(不同时间点的均值)(3)结合p0和p1谱。基于留一法交叉验证,与只基于p0或p1相比,基于结合p0和p1谱的模型有出众的表现,预测与药物敏感性显著相关(图5B,D)。同时,基于p1的模型比基于p0的预测表现好。接下来在每个时间点基于三组markers评估预测效能(图5C,E),发现p1和p0+p1模型在比较晚的时间点有更好的预测表现。不同时间点的不同的预测表现说明在治疗后的不同阶段,蛋白响应反映出靶点抑制和相关的干扰,细胞需要一定的时间来给信号通路重新布线以适应治疗压力,因此对于预测模型来说诱导蛋白改变是有益的。总之,结果支持了RPPA数据的高质量,并且说明治疗后蛋白水平变化能够提供预测治疗效果的一定的信息背景。

04

一个系统的“药物-蛋白”Connectivity Map

接下来系统的评估该工作蛋白响应数据的效用,基于RPPA数据构建了一个蛋白质-药物connectivity map。在这个图谱里,每一个节点代表一个蛋白或一个药物,基于是否药物治疗引起蛋白的显著改变对蛋白质-药物联通,基于是否两个药物引起相似蛋白响应对药物-药物联通(图6A)。不出所料,具有相同的靶点的药物聚类在一起,说明其具有相似下游蛋白响应。还发现PARP抑制剂有相似和对立关系的药物,说明潜在的累加性或对立的效应的药物组合。

接下来研究了图谱中蛋白质-蛋白质互作关系。对于给定的药物治疗,将RPPA蛋白分类成扰动蛋白和其他蛋白。基于STRING数据库,发现扰动蛋白互作多,说明一个药物导致的co-perturbed蛋白趋向涉及相同生物学通路并且作为一个信号级联的一部分进行互作(图6B)。使用药物-中心的蛋白邻居,最初集中于通过酪氨酸激酶信号和其下游网络,selumetinib、AZD8055、GSK1838705A和sapitinib,发现在抑制剂扰动细胞中蛋白网络有显著重叠。

05

基于蛋白质响应数据预测药物联合

接下来基于通路-水平蛋白质响应,开发了一个预测药物联合的整合分析方法(图7A):(1)使用药物-中心的connectivity map来推断上调和下调的通路;(2)进行相关性分析来识别耐药通路影响的药物。最后识别到 9类药物的150种药物组合(图7B)。发现>50%识别的药物组合有在文献报道或临床研究。

然后,集中于selumetinib + MK-2206这组药物组合进行CTRPv2敏感性验证分析。比较单药和组合的药物敏感性,发现单药的AUC值显著高于联合用药(图7C)。接下来比较单药和组合的蛋白响应数据(图7D),发现不同分析的三种模式:(1)两个药物对通路有相似影响,组合用药会加重效果;(2)一个药物使通路改变,组合用药会加重效果;(3)每个药物有相反的效果。

06

一个友好的蛋白质响应数据资源 CouchDB

该工作开发名为“Cancer Perturbed Proteomics Atlas”(https://bioinformatics.mdanderson.org/public-software/cppa)的数据资源,提供蛋白响应数据。数据库主要提供四种交互式模块:“Data Summary”、“My Protein”、“Connectivity Map”和“Analysis”。

“Data Summary”模块提供每个样本的详细信息(包括细胞系、药物、剂量、时间和细胞环境)。能够通过tree-view下载数据集。“My Protein”模块提供RPPA蛋白markers的注释,包括相应的基因和抗体信息。“Connectivity Map”模块提供一个交互式界面,能够通过visual和layout浏览蛋白-药物和药物-药物connectivity map。“Analysis”模块提供三种常见的分析方法,能够分析蛋白质响应与药物/化合物的关联,包括蛋白响应(Dp)排序、蛋白响应和药物敏感性关联性的火山图,以及不同敏感和耐药细胞系分组的差异蛋白相依的箱式图。

小编总结

该工作使用反相蛋白阵列(RPPAs)生成并编辑了一个大的肿瘤细胞系对多种临床相关药物响应的的扰动蛋白表达谱。首先对数据进行质量控制分析,评估RPPA与蛋白质质谱的一致性。然后对乳腺癌细胞系的蛋白质响应与药效关系分析表明,基于RPPA的蛋白质响应数据能够捕获药物治疗的表型效应,也揭示了药物敏感性的分子机制。p0+p1模型对于药效预测有更好的预测表现。然后基于RPPA数据构建了一个蛋白质-药物connectivity map,研究网络中药物与蛋白质,蛋白质与蛋白质的关系。接下来是开发了一个预测药物联合的方法。最后构建蛋白响应数据资源CouchDB,能够让研究人员直观和高效的探索、分析和可视化基于RPPA蛋白响应数据。

引用:

Zhao W, Li J, Chen MM, Luo Y, Ju Z, Nesser NK, Johnson-Camacho K, Boniface CT, Lawrence Y, Pande NT, Davies MA, Herlyn M, Muranen T, Zervantonakis IK, von Euw E, Schultz A, Kumar SV, Korkut A, Spellman PT, Akbani R, Slamon DJ, Gray JW, Brugge JS, Lu Y, Mills GB, Liang H. Large-Scale Characterization of Drug Responses of Clinically Relevant Proteins in Cancer Cell Lines. Cancer Cell. 2020 Oct 26:S1535-6108(20)30539-0. doi: 10.1016/j.ccell.2020.10.008. Epub ahead of print. PMID: 33157050.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-12-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档