专栏首页生信技能树TNBC分型研究的来龙去脉(逆向收费读文献2019-09)

TNBC分型研究的来龙去脉(逆向收费读文献2019-09)

栏目起源

2年前,考虑到科研路的艰难,我组建了文献阅读小组,广邀粉丝参与,从自身做起,开始学习及分享!感兴趣可以点击下面的链接跳转去了解详情:

逆向收费读文献社群 (2018-01-07)

逆向收费读文献社群 (2018-06-09)

逆向收费读文献社群(第二年通知)(2019-01-26)

大概有50人加入吧,成功坚持下来的朋友们累积了 200多文献阅读笔记,反而是公众号编辑忙不过来,所以大多数好的笔记无缘跟粉丝见面,不过我自己的笔记可以开绿色通道,现在开启系列连载:

预测BRCA基因功能缺陷的HRDetect基因集(逆向收费读文献)

本次更新的《TNBC分型研究的来龙去脉》为2019 第九周分享

早在2018年第46周文献分享,我就介绍过TNBC亚型的研究:https://zhuanlan.zhihu.com/p/49574829

研究团队通过贝勒医学院分两次收集了198个TNBC病人, (discovery set: n=84; validation set: n=114) 比较稳定的把TNBC分成了4个亚型,而且还分析了7个公共数据集来验证其结论。作者还整理的4个亚型以及其可能的靶点,作为研究亮点。当时也展开对比了其它分类研究,因为目前TNBC是BRCA里面预后最差的, 所以关于它的研究比较火热,但是根据基因表达进行分子分型的到不多,值得系统性的通读一遍,争取完全掌握该小领域的研究脉络。

其实TNBC是临床病理分类(基于IHC结果),它与分子分型(PAM50)的 basel-like 组别重合度很高,如下:

名词解释

新辅助化疗

病理完全缓解(pCR)指标

最出名(2011)的分子分型研究

依据全局基因表达进行分型最出名的是Lehmann的2011那篇JCI的芯片整合分析文章,还开发了网页工具:http://cbc.mc.vanderbilt.edu/tnbc/

可以得到 7 subtypes (BL1, BL2, M, IM, MSN, LAR) , 1 unstable subtype (UNS).

Based on 3,247 gene expression profiles from 21 breast cancer data sets, we discovered six TNBC subtypes including 2 basal-like (BL1 and BL2), an immunomodulatory (IM), a mesenchymal (M), a mesenchymal stem–like (MSL), and a luminal androgen receptor (LAR) subtype from 587 TNBC samples with unique gene expression patterns and ontologies.

文献在:

TNBCtype: A Subtyping Tool for Triple-Negative Breast Cancer Xi Chen, Jiang Li, William H. Gray, Brian D. Lehmann, Joshua A. Bauer, Yu Shyr, Jennifer A. Pietenpol Cancer Informatics, 2012:11 147-156, doi:10.4137/CIN.S9983

Identification of human triple-negative breast cancer subtypes and preclinical models for selection of targeted therapies Brian D. Lehmann, Joshua A. Bauer, Xi Chen, Melinda E. Sanders, A. Bapsi Chakravarthy, Yu Shyr, Jennifer A. Pietenpol J Clin Invest. 2011; 121(7):2750–2767 doi:10.1172/JCI45014

有趣的是,作者整理的公共数据集,其实并没有临床医生根据IHC结果来定义其为TNBC,只不过是他们使用了ER,PR,HER2的探针来定义表达量的阴性,这样划分了mRNA水平的TNBC,然后对其进行分子分型。

有了分子分型的理论基础,加上有简单方便的网页工具供大部分生物学家使用,而且是TNBC领域第一篇,该分型方法想不广为流传都难,这也就是它在不到10年就被引用超过2000次的原因。

而且后来的综述或者其它分型研究都会引用它:

J Breast Cancer. 2016 Sep; 19(3): 223–230.

Oncotarget. 2018 May 29; 9(41): 26406–26416.

Breast Care 2017;12:8-14 https://doi.org/10.1159/000455820

通读几篇综述可以发现,其实值得业界认可的几个分类方法并不多,虽然Lehmann的2011那篇JCI的芯片整合分析文章最早,但是跟预后联系不紧密,以至于临床效果不好。 所以后来作者2016年在plos one 发文重新修订了 之前的6分类,变成4类: (TNBCtype-4) tumor-specific subtypes (BL1, BL2, M and LAR) ,也产出新的数据 GSE81838 来验证。

但是该分类依靠2188个基因表达,不适合临床应用,所以发表于 Ring et al. BMC Cancer (2016) 的文章 DOI 10.1186/s12885-016-2198-0 使用一系列机器学习算法把基因数量减少到了101个

分子分型的临床意义

因为该分子分型的深入人心,所以就有有大量的研究基于其来探索分子分型的临床意义

发表在 Clin Cancer Res. 2013 October的 文章 Differential response to neoadjuvant chemotherapy among 7 triple-negative breast cancer molecular subtypes , 纳入了146个TNBC的表达芯片数据,作者首先重复Lehmann的2011的研究,可以比较好的区分出 BL1, M, IM, MSL, and LAR 亚型,但是BL2 and UNS就比较模糊。奇怪是作者的数据在不同的GSE: GSE25066 , GSE25055, GSE25065, GSE43502 and GSE31519.

这些病人接受的新辅助化疗不一样:

16 patients received an anthracycline regimen alone

3 patients received a taxane regimenalone

111 patients received both anthracycline and taxane regimens.

有趣的是2018年一篇oncotarget文章也是类似的实验,纳入了125个接受类似的新辅助化疗的TNBC病人,而且明明2011年那7个亚型已经进化成了 4 个亚型,但是作者依据旧的分组指标。数据在GSE106977,更诡异的是oncotarget文章声称他们招募的是TNBC患者,可是实际上走PAM50或者网页工具流程,都发现其招募的病人并不是basel-like居多。

(PS: 验证怀疑这篇文章的数据是有问题,欢迎大家联系我(邮件:jmzeng1314@163.com),一起来找bugs哈)

其它分组

发表在Clin Cancer Res 2015 ,贝勒医学院研究小组的 Burstein 等人对自己的数据,198个TNBC病人芯片表达矩阵,使用80个核心基因进行分组,得到4个TNBC的亚型。这个就是我在2018年第46周文献分享,TNBC亚型的研究:https://zhuanlan.zhihu.com/p/49574829 其分组与PAM50对比,和与2011的分型结果对比如下:

还有另外一个值得一提的分子分型文章发表在 Breast Cancer Research (2015) :Gene-expression molecular subtyping of triple-negative breast cancer tumours: importance of immune response,数据在 GSE58812, 法国研究团队的等人使用 适应性的Fuzzy-clustering 把107个TNBC患者分成3类

luminal androgen receptor (22%)

basal-like with low immune response and high M2-like macrophages (45%)

basal-enriched with high immune response and low M2-like macrophages (33%).

同时也分析公共数据集,GSE21653 进行验证,效果非常好,如下:

展望

考虑到TNBC的临床定义是IHC marker的ER,PR,HER2,是蛋白水平的检测,而目前主流的表达数据,都是mRNA水平的,不管是芯片还是ngs的,这中间的gap总是有的,那有没有可能直接使用蛋白质组学数据来对TNBC进行聚类然后划分分子亚型呢?

另外,目前能拿得出手就我介绍过的3个团队的分型结果,有没有可能再来一个大队列,又出现一些新的分型呢?

比如中国人群的TNBC队列:(2020年2月份)第5周(总第101周 )- 全球最大的三阴性乳腺癌队列多组学数据说了什么 ,详解:https://mp.weixin.qq.com/s/wWFYLBIfexaP1PuhqgcA9w

有没有可能联合其它ngs组学技术进行深度分型呢?

不同分型之间是否可以互相找差异的mRNA,miRNA,lncRNA来构建ceRNA网络呢?

A

B

作者

健明

本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • TCGA和METABRIC的TNBC病人数量到底是多少

    因为自己博士课题是关于乳腺癌肿瘤异质性的研究,所以对这个癌症的背景知识稍微多一点。顺理成章的我出的大量学徒作业也是关于乳腺癌的,其中乳腺癌里面最恶性的就是TNB...

    生信技能树
  • GEO数据库中国区镜像横空出世

    Install the development version from Github:

    生信技能树
  • B站课程《三阴性乳腺癌表达矩阵探索》笔记之文献解读

    本次文献解读涉及到三篇文章。这里要解读的第一篇是创建数据集的文章,后面的两篇文章在第一篇文章的数据集基础上进行了探索。

    生信技能树
  • 内存模型是怎么解决缓存一致性的

    我们在文章中提到过,由于CPU和主存的处理速度上存在一定差别,为了匹配这种差距,提升计算机能力,人们在CPU和主存之间增加了多层高速缓存。每个CPU会有L1、L...

    格姗知识圈
  • cmake简单使用教程

    小锋学长
  • Hexo + Github搭建自己的博客

    参考资料: https://blog.csdn.net/Hoshea_chx/article/details/78826689 https://www.ji...

    且行且珍惜_iOS
  • 在癌症治疗这件事上,要不要相信人工智能?

    机器之心原创 作者:虞喵喵 随深度学习技术的应用与成熟,人工智能也在不断拓展疆界。跨越传统的语音、图像、数据挖掘等强相关领域,人工智能正不断与物流、教育、金融等...

    机器之心
  • Android为每个应用分配多少内存?如何进行性能调优

    可以看到,设置largeHeap为true时, 通过rt.maxMemory();获取的值为512M。

    Android架构
  • Jmeter性能测试环境搭建

    jmeter技术研究
  • TCP socket心跳包示例程序

    http://blog.csdn.net/lisonglisonglisong/article/details/51327695#comments

    bear_fish

扫码关注云+社区

领取腾讯云代金券