导语
GUIDE ╲
同源重组(HR)通路对于高保真DNA双链断裂(DSB)修复是必不可少的,涉及许多基因,包括BRCA1和BRCA2。由于这些基因失活造成的HR缺陷(HRD)导致基因组改变水平的增加。HRD是许多肿瘤的共同特征,经常见于乳腺癌和卵巢癌。HRD的准确检测具有临床意义。
背景介绍
同源重组缺陷(HRD)导致双链断裂修复受损,是肿瘤发生的频繁驱动因素。今天,小编给大家带来了一项对同源重组缺陷进行的泛癌landscape研究,这篇文章于2020年11月发表在《Nature Communications》期刊上,影响因子14.919,题目为:Pan-cancer landscape of homologousrecombination defificiency.
数据介绍
使用了两项=临床研究(NCT01855477,NCT02925234)中的患者数据,对这些患者的配对的肿瘤/血液样本进行测序和统一分析。
ICGC:560个乳腺癌(BRCA-EU)体细胞突变数据
Pan-Cancer Analysis of Whole Genomes(PCAWG)数据集的ICGC部分的体细胞变异VCF文件和体细胞拷贝数TSV文件。
结果解析
01
随机森林分类器训练
以三种主要体细胞突变类别的发生作为训练的特征,初步的特征分析显示,与具有≥2bp侧翼同源性的小缺失相比,具有1bp侧翼同源性的小缺失更能预测BRCA1/2缺失.因此,具有侧翼同源性的缺失被进一步分为这两个同源性长度的bins。这29个特征的出现一起形成了每个样本的贡献配置文件。由此,计算了每个突变类别的相对贡献,以解释不同样本之间突变负荷的差异(Fig.1A)。然后训练一个随机森林模型来预测BRCA1或BRCA2缺失的概率(Fig.1B),模型称为CHORD。考虑到其他HR基因的缺陷可能导致类似的表型,作者以“BRCA1型HRD”和“BRCA2型HRD”来描述这些HRD亚型(Fig.1C)。
Fig.1
02
Performance of CHORD
使用两种方法来评估 CHORD 的性能。在第一种方法中,对训练数据执行 10 倍 CV,允许将每个样本从训练集中排除,之后可以确定无偏 HRD 概率。发现所有预测类别的概率(即 HRD、BRCA1型HRD、BRCA2型HRD)与遗传注释高度一致(Fig.2A)。通过计算AUROC和AUPRC曲线下的面积来量化预测和注释之间的一致性(Fig.2B、C)。
对于PCAWG数据集,包括1172个样本,其中从HMF数据集中选择样本的遗传标准相同。在这些样本上应用CHORD显示,BRCA-EU和PCAWG数据集的HRD概率与它们的BRCA1/2遗传状态一致(Fig.2D、G)。AUROC(>0.98)和AUPRC(>0.93)值与CV在所有预测类的HMF训练数据上获得的值相似(Fig.2E、F、H、I)。
Fig.2
03
BRCA2、RAD51C和PALB2与BRCA2型HRD相关,而只有BRCA1与BRCA1型HRD相关
为了深入了解HRD的遗传原因,作者将CHORD同时应用于HMF和PCAWG数据集,并选择了通过CHORD QC标准的样本。对于HMF数据集,作者还为每个患者选择了一个肿瘤(基于最高的肿瘤纯度)。共产生5122例患者(3504例来自HMF,1618例来自PCAWG),其中310例(6%)被归类为同源重组缺陷(sord-HRD)。其中,118例为BRCA1型HRD,192例为BRCA2型HRD。其余4812例患者被归类为同源重组熟练患者(sord-HRP)(Fig.3A)。
然后,作者希望通过对sord-HRD中的双等位基因失活基因进行富集分析来确定HRD表型背后的关键突变基因。从781个癌症相关基因列表(基于CancerGenome Interpreter)和HR相关基因(KEGG及文献检索)开始,考虑了可能的致病性变异(根据ClinVar)以及预测的impactful变异,如无义突变,以导致基因失活。结果表明,除了BRCA1和BRCA2,RAD51C和PALB2在HRD患者中使用q值阈值为0.05显著富集(Fig.3B)。
在所有sord-HRD HMF患者中,大约60%可以通过BRCA2、BRCA1、RAD51C或PALB2的双等位基因失活来解释,这通常是由LOH联合致病性变异或移码或深度缺失引起的(Fig.3C)。RAD51C和PALB2缺陷患者与BRCA2缺陷患者共同具有BRCA2型HRD表型(Fig.3C)。
Fig.3
04
HRD的发生率和遗传原因在不同组织类型和癌症分期不同
接下来,作者在原发(PCAWG)和转移性(HMF)癌症数据集中的原发肿瘤位置研究了HRD的发病率和遗传原因的差异。HRD在卵巢癌、乳腺癌、前列腺癌和胰腺癌中最为常见(总共85%),偶尔发生在其他癌症类型中(15%)。
与转移性癌相比,HRD在原发性卵巢癌(52%vs30%)和乳腺癌(24%vs12%)中更常见,在原发性前列腺癌(5.6%vs13%)和胰腺癌(7.3%vs13%)中发病率较低(Fig.4A)。然而,观察到的原发性队列和转移性队列之间的HRD率差异可能不一定是决定性的,因为不能排除患者纳入标准等混杂因素。在不同类型的癌症中,作者观察到HR功能丧失的显著多样性(Fig.4B)。
在94%的sord-HRD患者中,作者发现四个HRD相关基因(BRCA1、BRBA2、RAD51C)中至少一个单等位基因或双等位基因失活(Fig.4C)。作者还发现,双等位基因的丢失往往与不同癌症种系易感性有关(Fig.4D)。卵巢癌(32%)、乳腺癌(36%)和胰腺癌(56%)患者,但前列腺癌患者(24%)的程度较低。另一方面,双等位基因丢失只发生在相当大比例的sord-HRD患者(35%全血癌)中,前列腺癌(54%)主要是由于深度缺失。尽管这些频率可能不能完全代表每种癌症类型,但这些观察结果确实强调了体细胞变异作为HR基因失活的一种机制不应被忽视。
Fig.4
小编总结
因此,虽然CHORD可以独立于潜在因素检测HRD,但HRD基因的基因检测也是对CHORD互补的,可以为对患者的HR状况做出最终判断提供支持信息。使用WGS的独特优势是,虽然在临床诊断中还不是常规,但可能在不久的将来,基因检测和基于突变的HRD检测可以同时进行。作者的分析结果促进了对当前检测HRD的临床实践的改进,并且将基于基因组的方法在临床中进行应用,并为患者提供额外的治疗选择。
同时作者还开发了R包CHORD免费供用户使用,可以在github中下载该包。