TNBC分型研究的来龙去脉(逆向收费读文献2019-09)

栏目起源

2年前,考虑到科研路的艰难,我组建了文献阅读小组,广邀粉丝参与,从自身做起,开始学习及分享!感兴趣可以点击下面的链接跳转去了解详情:

逆向收费读文献社群 (2018-01-07)

逆向收费读文献社群 (2018-06-09)

逆向收费读文献社群(第二年通知)(2019-01-26)

大概有50人加入吧,成功坚持下来的朋友们累积了 200多文献阅读笔记,反而是公众号编辑忙不过来,所以大多数好的笔记无缘跟粉丝见面,不过我自己的笔记可以开绿色通道,现在开启系列连载:

预测BRCA基因功能缺陷的HRDetect基因集(逆向收费读文献)

本次更新的《TNBC分型研究的来龙去脉》为2019 第九周分享

早在2018年第46周文献分享,我就介绍过TNBC亚型的研究:https://zhuanlan.zhihu.com/p/49574829

研究团队通过贝勒医学院分两次收集了198个TNBC病人, (discovery set: n=84; validation set: n=114) 比较稳定的把TNBC分成了4个亚型,而且还分析了7个公共数据集来验证其结论。作者还整理的4个亚型以及其可能的靶点,作为研究亮点。当时也展开对比了其它分类研究,因为目前TNBC是BRCA里面预后最差的, 所以关于它的研究比较火热,但是根据基因表达进行分子分型的到不多,值得系统性的通读一遍,争取完全掌握该小领域的研究脉络。

其实TNBC是临床病理分类(基于IHC结果),它与分子分型(PAM50)的 basel-like 组别重合度很高,如下:

名词解释

新辅助化疗

病理完全缓解(pCR)指标

最出名(2011)的分子分型研究

依据全局基因表达进行分型最出名的是Lehmann的2011那篇JCI的芯片整合分析文章,还开发了网页工具:http://cbc.mc.vanderbilt.edu/tnbc/

可以得到 7 subtypes (BL1, BL2, M, IM, MSN, LAR) , 1 unstable subtype (UNS).

Based on 3,247 gene expression profiles from 21 breast cancer data sets, we discovered six TNBC subtypes including 2 basal-like (BL1 and BL2), an immunomodulatory (IM), a mesenchymal (M), a mesenchymal stem–like (MSL), and a luminal androgen receptor (LAR) subtype from 587 TNBC samples with unique gene expression patterns and ontologies.

文献在:

TNBCtype: A Subtyping Tool for Triple-Negative Breast Cancer Xi Chen, Jiang Li, William H. Gray, Brian D. Lehmann, Joshua A. Bauer, Yu Shyr, Jennifer A. Pietenpol Cancer Informatics, 2012:11 147-156, doi:10.4137/CIN.S9983

Identification of human triple-negative breast cancer subtypes and preclinical models for selection of targeted therapies Brian D. Lehmann, Joshua A. Bauer, Xi Chen, Melinda E. Sanders, A. Bapsi Chakravarthy, Yu Shyr, Jennifer A. Pietenpol J Clin Invest. 2011; 121(7):2750–2767 doi:10.1172/JCI45014

有趣的是,作者整理的公共数据集,其实并没有临床医生根据IHC结果来定义其为TNBC,只不过是他们使用了ER,PR,HER2的探针来定义表达量的阴性,这样划分了mRNA水平的TNBC,然后对其进行分子分型。

有了分子分型的理论基础,加上有简单方便的网页工具供大部分生物学家使用,而且是TNBC领域第一篇,该分型方法想不广为流传都难,这也就是它在不到10年就被引用超过2000次的原因。

而且后来的综述或者其它分型研究都会引用它:

J Breast Cancer. 2016 Sep; 19(3): 223–230.

Oncotarget. 2018 May 29; 9(41): 26406–26416.

Breast Care 2017;12:8-14 https://doi.org/10.1159/000455820

通读几篇综述可以发现,其实值得业界认可的几个分类方法并不多,虽然Lehmann的2011那篇JCI的芯片整合分析文章最早,但是跟预后联系不紧密,以至于临床效果不好。 所以后来作者2016年在plos one 发文重新修订了 之前的6分类,变成4类: (TNBCtype-4) tumor-specific subtypes (BL1, BL2, M and LAR) ,也产出新的数据 GSE81838 来验证。

但是该分类依靠2188个基因表达,不适合临床应用,所以发表于 Ring et al. BMC Cancer (2016) 的文章 DOI 10.1186/s12885-016-2198-0 使用一系列机器学习算法把基因数量减少到了101个

分子分型的临床意义

因为该分子分型的深入人心,所以就有有大量的研究基于其来探索分子分型的临床意义

发表在 Clin Cancer Res. 2013 October的 文章 Differential response to neoadjuvant chemotherapy among 7 triple-negative breast cancer molecular subtypes , 纳入了146个TNBC的表达芯片数据,作者首先重复Lehmann的2011的研究,可以比较好的区分出 BL1, M, IM, MSL, and LAR 亚型,但是BL2 and UNS就比较模糊。奇怪是作者的数据在不同的GSE: GSE25066 , GSE25055, GSE25065, GSE43502 and GSE31519.

这些病人接受的新辅助化疗不一样:

16 patients received an anthracycline regimen alone

3 patients received a taxane regimenalone

111 patients received both anthracycline and taxane regimens.

有趣的是2018年一篇oncotarget文章也是类似的实验,纳入了125个接受类似的新辅助化疗的TNBC病人,而且明明2011年那7个亚型已经进化成了 4 个亚型,但是作者依据旧的分组指标。数据在GSE106977,更诡异的是oncotarget文章声称他们招募的是TNBC患者,可是实际上走PAM50或者网页工具流程,都发现其招募的病人并不是basel-like居多。

(PS: 验证怀疑这篇文章的数据是有问题,欢迎大家联系我(邮件:jmzeng1314@163.com),一起来找bugs哈)

其它分组

发表在Clin Cancer Res 2015 ,贝勒医学院研究小组的 Burstein 等人对自己的数据,198个TNBC病人芯片表达矩阵,使用80个核心基因进行分组,得到4个TNBC的亚型。这个就是我在2018年第46周文献分享,TNBC亚型的研究:https://zhuanlan.zhihu.com/p/49574829 其分组与PAM50对比,和与2011的分型结果对比如下:

还有另外一个值得一提的分子分型文章发表在 Breast Cancer Research (2015) :Gene-expression molecular subtyping of triple-negative breast cancer tumours: importance of immune response,数据在 GSE58812, 法国研究团队的等人使用 适应性的Fuzzy-clustering 把107个TNBC患者分成3类

luminal androgen receptor (22%)

basal-like with low immune response and high M2-like macrophages (45%)

basal-enriched with high immune response and low M2-like macrophages (33%).

同时也分析公共数据集,GSE21653 进行验证,效果非常好,如下:

展望

考虑到TNBC的临床定义是IHC marker的ER,PR,HER2,是蛋白水平的检测,而目前主流的表达数据,都是mRNA水平的,不管是芯片还是ngs的,这中间的gap总是有的,那有没有可能直接使用蛋白质组学数据来对TNBC进行聚类然后划分分子亚型呢?

另外,目前能拿得出手就我介绍过的3个团队的分型结果,有没有可能再来一个大队列,又出现一些新的分型呢?

比如中国人群的TNBC队列:(2020年2月份)第5周(总第101周 )- 全球最大的三阴性乳腺癌队列多组学数据说了什么 ,详解:https://mp.weixin.qq.com/s/wWFYLBIfexaP1PuhqgcA9w

有没有可能联合其它ngs组学技术进行深度分型呢?

不同分型之间是否可以互相找差异的mRNA,miRNA,lncRNA来构建ceRNA网络呢?

A

B

作者

健明

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2019-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券