前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nature Communications|同源重组缺陷的泛癌landscape

Nature Communications|同源重组缺陷的泛癌landscape

作者头像
作图丫
发布2022-03-29 13:49:00
5530
发布2022-03-29 13:49:00
举报
文章被收录于专栏:作图丫

导语

GUIDE ╲

同源重组(HR)通路对于高保真DNA双链断裂(DSB)修复是必不可少的,涉及许多基因,包括BRCA1和BRCA2。由于这些基因失活造成的HR缺陷(HRD)导致基因组改变水平的增加。HRD是许多肿瘤的共同特征,经常见于乳腺癌和卵巢癌。HRD的准确检测具有临床意义。

背景介绍

同源重组缺陷(HRD)导致双链断裂修复受损,是肿瘤发生的频繁驱动因素。今天,小编给大家带来了一项对同源重组缺陷进行的泛癌landscape研究,这篇文章于2020年11月发表在《Nature Communications》期刊上,影响因子14.919,题目为:Pan-cancer landscape of homologousrecombination defificiency.

数据介绍

使用了两项=临床研究(NCT01855477,NCT02925234)中的患者数据,对这些患者的配对的肿瘤/血液样本进行测序和统一分析。

ICGC:560个乳腺癌(BRCA-EU)体细胞突变数据

Pan-Cancer Analysis of Whole Genomes(PCAWG)数据集的ICGC部分的体细胞变异VCF文件和体细胞拷贝数TSV文件。

结果解析

01

随机森林分类器训练

以三种主要体细胞突变类别的发生作为训练的特征,初步的特征分析显示,与具有≥2bp侧翼同源性的小缺失相比,具有1bp侧翼同源性的小缺失更能预测BRCA1/2缺失.因此,具有侧翼同源性的缺失被进一步分为这两个同源性长度的bins。这29个特征的出现一起形成了每个样本的贡献配置文件。由此,计算了每个突变类别的相对贡献,以解释不同样本之间突变负荷的差异(Fig.1A)。然后训练一个随机森林模型来预测BRCA1或BRCA2缺失的概率(Fig.1B),模型称为CHORD。考虑到其他HR基因的缺陷可能导致类似的表型,作者以“BRCA1型HRD”和“BRCA2型HRD”来描述这些HRD亚型(Fig.1C)。

Fig.1

02

Performance of CHORD

使用两种方法来评估 CHORD 的性能。在第一种方法中,对训练数据执行 10 倍 CV,允许将每个样本从训练集中排除,之后可以确定无偏 HRD 概率。发现所有预测类别的概率(即 HRD、BRCA1型HRD、BRCA2型HRD)与遗传注释高度一致(Fig.2A)。通过计算AUROC和AUPRC曲线下的面积来量化预测和注释之间的一致性(Fig.2B、C)。

对于PCAWG数据集,包括1172个样本,其中从HMF数据集中选择样本的遗传标准相同。在这些样本上应用CHORD显示,BRCA-EU和PCAWG数据集的HRD概率与它们的BRCA1/2遗传状态一致(Fig.2D、G)。AUROC(>0.98)和AUPRC(>0.93)值与CV在所有预测类的HMF训练数据上获得的值相似(Fig.2E、F、H、I)。

Fig.2

03

BRCA2、RAD51C和PALB2与BRCA2型HRD相关,而只有BRCA1与BRCA1型HRD相关

为了深入了解HRD的遗传原因,作者将CHORD同时应用于HMF和PCAWG数据集,并选择了通过CHORD QC标准的样本。对于HMF数据集,作者还为每个患者选择了一个肿瘤(基于最高的肿瘤纯度)。共产生5122例患者(3504例来自HMF,1618例来自PCAWG),其中310例(6%)被归类为同源重组缺陷(sord-HRD)。其中,118例为BRCA1型HRD,192例为BRCA2型HRD。其余4812例患者被归类为同源重组熟练患者(sord-HRP)(Fig.3A)。

然后,作者希望通过对sord-HRD中的双等位基因失活基因进行富集分析来确定HRD表型背后的关键突变基因。从781个癌症相关基因列表(基于CancerGenome Interpreter)和HR相关基因(KEGG及文献检索)开始,考虑了可能的致病性变异(根据ClinVar)以及预测的impactful变异,如无义突变,以导致基因失活。结果表明,除了BRCA1和BRCA2,RAD51C和PALB2在HRD患者中使用q值阈值为0.05显著富集(Fig.3B)。

在所有sord-HRD HMF患者中,大约60%可以通过BRCA2、BRCA1、RAD51C或PALB2的双等位基因失活来解释,这通常是由LOH联合致病性变异或移码或深度缺失引起的(Fig.3C)。RAD51C和PALB2缺陷患者与BRCA2缺陷患者共同具有BRCA2型HRD表型(Fig.3C)。

Fig.3

04

HRD的发生率和遗传原因在不同组织类型和癌症分期不同

接下来,作者在原发(PCAWG)和转移性(HMF)癌症数据集中的原发肿瘤位置研究了HRD的发病率和遗传原因的差异。HRD在卵巢癌、乳腺癌、前列腺癌和胰腺癌中最为常见(总共85%),偶尔发生在其他癌症类型中(15%)。

与转移性癌相比,HRD在原发性卵巢癌(52%vs30%)和乳腺癌(24%vs12%)中更常见,在原发性前列腺癌(5.6%vs13%)和胰腺癌(7.3%vs13%)中发病率较低(Fig.4A)。然而,观察到的原发性队列和转移性队列之间的HRD率差异可能不一定是决定性的,因为不能排除患者纳入标准等混杂因素。在不同类型的癌症中,作者观察到HR功能丧失的显著多样性(Fig.4B)。

在94%的sord-HRD患者中,作者发现四个HRD相关基因(BRCA1、BRBA2、RAD51C)中至少一个单等位基因或双等位基因失活(Fig.4C)。作者还发现,双等位基因的丢失往往与不同癌症种系易感性有关(Fig.4D)。卵巢癌(32%)、乳腺癌(36%)和胰腺癌(56%)患者,但前列腺癌患者(24%)的程度较低。另一方面,双等位基因丢失只发生在相当大比例的sord-HRD患者(35%全血癌)中,前列腺癌(54%)主要是由于深度缺失。尽管这些频率可能不能完全代表每种癌症类型,但这些观察结果确实强调了体细胞变异作为HR基因失活的一种机制不应被忽视。

Fig.4

小编总结

因此,虽然CHORD可以独立于潜在因素检测HRD,但HRD基因的基因检测也是对CHORD互补的,可以为对患者的HR状况做出最终判断提供支持信息。使用WGS的独特优势是,虽然在临床诊断中还不是常规,但可能在不久的将来,基因检测和基于突变的HRD检测可以同时进行。作者的分析结果促进了对当前检测HRD的临床实践的改进,并且将基于基因组的方法在临床中进行应用,并为患者提供额外的治疗选择。

同时作者还开发了R包CHORD免费供用户使用,可以在github中下载该包。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档