使用RNA-seq数据通过网络熵评估肿瘤内异质性摘要介绍

scientific report第6卷,文章编号:37767(2016)

摘要

肿瘤内异质性(ITH)出现在肿瘤进展、转移和复发的不同阶段,而这些对于临床应用是重要的。我们使用来自肿瘤样品的RNA测序数据,并根据生物网络状态测量ITH水平。为了模拟基因之间的复杂关系,我们使用蛋白质相互作用网络来考虑基因 - 基因关系。通过使用两个网络nJSD与JSD之间的基于熵的距离度量来测量ITH。使用nJSD,我们定义了基于转录组的ITH(tITH)。使用真实的生物数据集对与ITH相关的问题进行了广泛的测试。研究人类癌细胞系数据和单细胞测序数据以验证我们的方法。然后,我们分析了TCGA泛癌6,320例患者。我们的结果与广泛使用的基于基因组的ITH推断方法一致,ITH在生存分析中表现出很好的性能。对小鼠克隆进化数据的分析进一步证实,我们的基于转录组的ITH与不同克隆进化阶段的遗传异质性一致。此外,我们发现细胞周期相关途径对克隆进化过程中增加网络异质性有显着贡献。我们相信所提出的基于转录组的ITH可用于RNA水平的肿瘤样品的异质性。

介绍

癌症具有由不同癌症细胞组成的复杂系统,所述癌症细胞彼此相互作用并且还与正常细胞相互作用,称为肿瘤内异源性(ITH)。 ITH的复杂性是了解癌症系统动力学的一个主要障碍,也难以预测治疗结果。肿瘤内异质性是单个肿瘤细胞进化的结果。这种ITH的主要原因之一是癌细胞的基因组不稳定性。高通量测序技术广泛用于在分子水平上测量ITH。最近的一项研究表明,具有不同基因组特征的多种细胞在单个肿瘤中共存。细胞的多样性在转移中具有进化优势。另外,已知多种亚克隆在治疗环境中处于自然选择的高压下,甚至引起治疗抗性。化疗期间的克隆进化使目前的靶向药物治疗变得困难。然而,在瘤形成过程中仍然存在关于选择性过程的进化问题,即选择和存活哪些子细胞。对于这个问题,一项结肠癌研究表明,没有选择性扫描的大爆炸模型和肝癌研究提出了肿瘤的非达尔文进化。无论选择性力是否存在,亚克隆的过度生产都很可能导致ITH。(这一段是阐述,肿瘤异质性导致了许多治疗困难,而ITH可能是肿瘤异质性的原因)

已经用多区域肿瘤测序鉴定了分子水平ITH。尽管这种多区域测序处于ITH研究的最前沿,但单细胞基因组学已成为最可靠的技术。单细胞测序对每个克隆的直接测序具有优势。然而,单细胞测序的实验成本对于临床应用而言太高。因此,研究人员开发了计算方法,用大块肿瘤测序数据推断ITH,作为每个克隆基因组信息的聚合元数据。通常,子细胞携带完全相同的亲本基因组信息。然而,他们的DNA复制系统通常在癌症中发生故障,并且留下了新的突变特征,此外还有拷贝数改变(CNA)和杂合性丢失(LOH)。那些基因组改变仍然代代相传,因此能够回溯基因组特征。基于同样的原理,从大量肿瘤测序的基因组景观推断亚克隆是一种广泛使用的策略。计算方法,如PyClone和EXPANDS,是目前最先进的工具,使用突变信息推断亚克隆种群。推断ITH的临床相关性也与预后结果有关。

尽管基于基因组信息的ITH推断是成功的,但还有一些问题需要进一步研究。例如,一项研究报告说,具有中等数量亚克隆(3或4个克隆)的患者比更多异构患者(超过4个克隆)的风险更高。他们讨论了在多样性的优势和产生可变子细胞的成本之间存在权衡,然而如前所述,癌症进展期间的选择性扫描仍然存在问题。为了更好地理解肿瘤异质性和克隆进化过程,我们需要研究基因组信息用于ITH预测时的三个问题。首先,很难确定体细胞突变是否是癌症基因组进化方面的驱动因素或乘客突变。关于肿瘤中性进化的研究提出,在某种情况下,驱动突变可以有不同的改变。因此,用驱动基因突变推断ITH可能无法反映真正的亚克隆群体。其次,单独的突变信息不足以鉴定癌症中亚克隆的细胞活性。此外,ITH需要考虑细胞可塑性,因为癌症亚克隆的表型可以在没有遗传基因组变异的情况下改变。结肠癌研究表明,不同的表型可以存在,基因型没有差异。最后,癌症微环境在克隆进化,肿瘤进展和转移中很重要。根据目前的研究,不同的克隆活动和周围的基质和免疫细胞对癌症进展的影响。这一发现也在单细胞测序研究中得到证实。然而,突变谱系分析只能检测癌症克隆的异质性,而不能检测微环境因素的其他影响。因此,我们认为,除了目前基于DNA的ITH推断之外,在RNA水平上测量ITH可以为ITH及其临床应用提供新的见解。

为了研究异质克隆的功能差异,我们开发了一种使用RNA测序数据进行ITH推断的方法。使用RNA测序数据有两个主要原因。首先,RNA测序数据与基因组数据一样普遍存在。其次,像突变一样,转录组也用于进化研究35,36。然而,RNA水平的分析存在挑战。需要考虑复杂的基因 - 基因依赖性37。因此,我们使用生物网络,这是建立复杂基因 - 基因关系的最有效工具 - 蛋白质相互作用网络(PIN)和途径信息38,39,40。

给定网络,需要有效的度量来量化网络扰动的差异,以反映单个基因的表达水平及其关系,例如网络拓扑以及基因的共表达。我们使用信息理论方法来测量网络状态。这种方法在基因表达变化方面成功地测量了网络扰动[41,42,43]。该熵测量对于检测从正常状态到疾病状态的网状态转变也是有效的44,45。最近网络熵的应用成功地显示了原发性肿瘤和转移性肿瘤之间的差异46。此外,Teschendorff小组的信号熵研究确定了网络熵与分化潜能之间的关系,另外还有预后的重要性47,48,49。

我们的假设是异质性肿瘤在网络中的模糊性比同质性肿瘤更明显(图1)。因此,我们使用信息论,基于网络的Jensen-Shannon Divergence(nJSD)50,利用转录组数据开发了一种新的ITH测量方法。我们的方法针对与ITH相关的问题进行了广泛测试。为了概念验证,我们使用了人类癌症细胞系数据和单细胞测序数据。然后,分析泛癌队列数据。我们的结果与广泛使用的基于基因组的ITH推断方法一致。此外,我们的方法还测试了免疫细胞浸润。最后,小鼠克隆进化分析表明,我们的网络扰动推断与不同克隆进化阶段的ITH一致。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

黑科技 | 这个人工智能项目,正在把蜻蜓变成无人机

编译 | 量子位 若朴 Draper正在开发一个带有集能源,指导和导航系统于一身的昆虫控制“背包”,这里展示的就是一个被植入控制背包的蜻蜓。 不管我们有多努力...

2316
来自专栏生信宝典

生信老司机以中心法则为主线讲解组学技术的应用和生信分析心得 - 限时免费

海哥,中国科学院遗传与发育生物学研究所,生物信息学博士。在生信宝典出品过多部“傻瓜式”教程。

762
来自专栏新智元

【北航新型人工突触】能模拟人类神经系统基本功能的人工突触诞生

【新智元导读】近日 ACS Nano 刊登了一项研究报告,称已开发出能够模拟我们神经系统基本功能的人工突触,能够从同一“突触前”末端释放抑制和刺激信号。这项研究...

3595
来自专栏生信宝典

2018国内基因编辑技术走势

3月30~31日,由北京大学天然药物及仿生药物国家重点实验室主办的2018基因编辑学术研讨会将在京举行。届时众多一线科研工作者将聚集于此共襄学术盛宴。 201...

5714
来自专栏生信技能树

2433个乳腺癌患者的173个基因的突变全景图

乳腺癌具有患者间与同一患者肿瘤内的基因组变异性。以患者间的异源性分类早期乳腺癌生物亚型,现在临床对乳腺癌患者通常是观察 morphological assess...

1752
来自专栏生信小驿站

Potent immunogenicity in BRCA1-mutated patients with high-grade serous ovarian carcinoma摘要介绍

高级别浆液性卵巢癌(HGSOCs)是免疫检查点抑制剂(ICIs)效果不理想的肿瘤之一。因此必须开发可行的生物标志物,用于鉴定响应候选者并指导HGSOC患者的精确...

1141
来自专栏大数据文摘

盘点:幸运儿才有的8项基因突变,你有吗?

2273
来自专栏大数据文摘

新型算法可确定基因组突变位点

2018
来自专栏思影科技

揭示受伤大脑隐藏认知的EEG信号特征

来自美国哈佛医学院的William H. Curley试图探索能够作为意识障碍患者认知能力指标的EEG信号特征,并检验将来用于重建沟通的可靠性。该研究发表在《B...

3058
来自专栏生信技能树

CRISPR相关公司的股价大跌背后的故事

被称为基因魔剪的CRISPR-Cas9(Clustered Regularly Interspaced Short Palindromic Repeats)技...

1771

扫码关注云+社区

领取腾讯云代金券