TME文献精读 | 基于机器学习的体细胞突变检测方法

王诗翔呀

发布于 2020-07-06 17:25:19

1.4K0

文章被收录于专栏：优雅R优雅R

全文摘要

体细胞突变检测准确性可能会影响癌症患者的突变发现和治疗管理。为了解决这个问题，作者在机器学习的基础上开发了一种体细胞突变发现方法，该方法在识别经过验证的肿瘤改变方面优于现有方法（敏感性97％ vs 90％~99％；阳性预测值98％ vs 34％~92％）。使用此方法对来自1368 TCGA样本的成对肿瘤正常外显子组数据进行分析，该算法与TCGA MC3突变集的一致性为74％，并且还发现TCGA MC3集中可能存在假阳性和假阴性突变，包括在临床上可靶向的基因。对于先前用免疫检查点抑制剂治疗过的黑色素瘤和肺癌患者，该机器学习算法的高质量体细胞突变评估可改善基于肿瘤突变负荷的临床结果预测。与其他临床测序分析相比，将机器学习突变检测应用于临床二代测序（NGS）分析中可以提高检测结果的准确性。以上分析基于机器学习的分析可改进对肿瘤特异性突变的鉴定，并对癌症患者的研究和临床管理具有重要意义。

结果

基于机器学习Cerebro检测高可信度体细胞突变的策略概览

大致流程：配对的肿瘤、正常组织的全外显子测序→2种方法将测序结果比对到hg19参考基因组，以获得共识突变召回→选择一些列指标来描述突变，纳入考虑的特征有不同的覆盖度、突变等位频率、GC含量和比对质量等→使用极度随机森林分类模型（cerebro）评估一系列决策树，评估候选突变的可信度，为每一个候选突变打分。为了得到高可置信度的突变结果，研究者采用了严格的候选突变排除标准，具体如下：

somatic confidence scores <0.75
<3 distinct mutant fragments in the tumor,
<10% mutant allele fraction (MAF) in the tumor
<10 distinct coverage in the normal sample were removed.

构建训练模型数据集：

正常外周血DNA，使用NGS测序两次。合并数据集，用以检测体细胞变异。

其中一份数据：作为配对正常样本。
其中第二份数据：通过计算机算法模拟，将超过30000体细胞变异事件（包括碱基替代、插入和缺失，突变位点占比 1.5％到100％）引入NGS数据中，为分类器提供一系列肿瘤特异性突变。同时引入将被错误识别为突变的超过200万个NGS错误和测序伪像（为分类器提供了试验获得的代表结果）。构建训练数据集是机器学习的一部分内容，添加计算机突变的优点：试验获得的突变在整个外显子区域不能提供足够的灵敏度，而计算机模拟可提供片段内的训练数据。

评估机器学习发现突变的准确性

Fig 2：作者使用模拟和试验中的肿瘤外显子测序数据集对模型效能进行验证，总共进行了3个研究的验证。

验证数据集：具有外显子二代测序结果的6株正常细胞系。对其进行3个研究，其中2个研究中加入计算机模拟的突变，以分别模拟低纯度和高肿瘤纯度的肿瘤。

2A：第一个研究，模拟低肿瘤纯度样本测序结果。通过在具有外显子NGS的6株正常细胞系中加入132编码基因体细胞突变（120个单碱基替换和12个插入缺失）模拟低肿瘤纯度的肿瘤，外显子数据的突变等位基因频率为10%-25%。cerebro有最高的敏感性和阳性预测值。

2B: 第二个研究，模拟高肿瘤纯度样本测序结果。加入计算机模拟的外显子数据，包含7000 个体细胞单碱基替换（1000）和插入缺失（各1000）改变，突变等位基因频率为10%-100%。在6个样本中共构成可检测的42000个体细胞突变。

亚组比较：不同的算法在不同突变类型、等位突变频率的样本敏感度不同。cerebro有最高的敏感性和阳性预测值。

2C：第三个研究，试验获得的数据：5个配对的肿瘤和正常样本，其体细胞突变在早期通过独立的全外显子测序证实。

金标准：VarDict, MuTect 1, our Cerebro pipeline共同识别的突变；未通过视觉审核+ddPCR验证。

突变位点情况：因为Sanger 序列分析被设计来识别克隆和克隆附近的碱基改变，故在原来314突变的基础上，作者增加163（由多个NGS突变识别算法共识）+18个（ ddPCR 识别）突变。

结果：通过比较各算法突变召回率，揭示Cerebro有最高的整体准确性。

评估Cerebro 在TCGA数据集中的突变召回准确性

Table 1为纳入数据集：与靶向治疗和免疫治疗相关的数据集：非小细胞肺腺癌、非小细胞肺鳞癌和膀胱泌尿道肿瘤；高突变负荷的肿瘤数据集：皮肤黑色素瘤、胃癌、头颈肿瘤、肝癌、肾癌和泌尿道肿瘤。总共1368名患者的配对肿瘤——正常样本的外显子测序。比较TCGA和cerebro的1368个样本外显子突变的结果，总共识别365539个体细胞突变，平均每个肿瘤246个体细胞突变。

Fig 3: 比较TCGA和cerebro的1368个样本外显子突变的结果

3A: TCGA MC3突变集与Cerebro 突变集的一致性探究 (Pearson相关系数 = 0.93, P < 0.0001)，两种方法共享74.0%的体细胞突变。

3B: cerebro检测出的10.3% 体细胞突变（n = 44,439）未在TCGA中检测出，TCGA中15.7%认为是体细胞突变（n = 68,138）而cerebro未能得出此结果。

Fig 4：Cerebro较TCGA中的突变检测准确性高。

为了进一步评估TCGA中的不一致变化，作者研究66个特征明确的癌症驱动基因的子集的体细胞突变情况。在评估的1368个肿瘤中，有1257个（占92％）在该基因组中发生了突变，TCGA和Cerebro之间共有4037个共有的体细胞突变，并且共有777个变化在分析之间不一致。

Fig 4A: 进一步检查表明，仅由TCGA检测出的429个突变中，大多数与不良的序列质量和比对问题有关，而这可能并不代表真正的突变。其中的原因可能有：等位突变频率＜5%；碱基比对质量差；肿瘤碱基质量＜30%等。

Fig 4B: 在FDA批准（左边）或正在进行的临床试验（右边）相关的驱动基因集中，211个样本中发现了低置信度TCGA突变（211/1257=16.8％）。可能的原因同4A。

Fig 4C: TCGA检测出的突变信度要比在两个平台上观察到的突变（P <0.0001）或Cerebro唯一检测到的突变（P <0.0001）要低。从上之下代表的分别是该成分在所有突变中所占的比例，包括正常组织等位突变频率＞1%；肿瘤突变比对质量＜40；肿瘤碱基质量＜30。

体细胞突变负荷与肿瘤免疫治疗的反应的相关性

为了评估肿瘤突变负荷与免疫检查点抑制剂治疗疗效的相关性，作者选取两个与免疫检查点相关的队列进行探究：队列1——接受抗PD-1治疗的34名非小细胞肺癌患者；队列2——接受抗CTLA-1治疗的64名皮肤黑色素瘤患者。对样本的NGS数据进行分析，将cerebro识别的突变与原出版物报道的突变进行对比（此处并不纳入非同义碱基替换，因为原出版未报道该类突变）。

Fig 5A: 在整个NSCLC队列中，原始报道和Cerebro分别确定了9049和6385个突变，一致率为48.2％；在黑色素瘤队列中，原始报道和Cerebro分别鉴定出25,753和32,092个突变，一致率为61.9％。

Fig 5B: 对原始报道中鉴定出的突变进行了深入描述，并发现绝大多数此类结果可能归因于系统性问题，例如在不同reads中对突变的观察有限对、突变位置的碱基质量差、比对不准确。而Cerebro可以将其视为假阳性，说明Cerebro敏感性较高。

肿瘤突变负荷与患者接受免疫检查点抑制剂治疗的预后相关，故作者进一步探究cerebrod的检测结果分类能否用于患者分类和临床预后。Cerebro分析揭示NSCLC 和melanoma组的平均单碱基替换分别为187 和 501，均匀原始发布时的结果有显著差异 (266 和402)。早先研究中，使用SomaticSniper检测皮肤黑色素瘤的体细胞突变，检测到的数量低于cerebro，敏感性低，与fig2A、2C结果一致。

Fig 5C-5D: 与先前的方法比较，cerebro的TMB结果增加对无进展生存期（NSCLC）和总体生(melanoma)预测效能。

利用cerebro的TMB结果对患者进行分层，纠正先前方法的预测结果，将4个预测为high TMB的NSCLC患者纠正为low TMB，将9 个预测为low TMB 的melanoma 患者纠正为high TMB, 提高预测效能。

以上数据提示，增加的体细胞突变检测效能会显著提高对患者的临床预后能力。

临床二代测序分析中的体细胞突变评估效能（cerebro与常见体细胞突变检测方法效能比较）

为了评估临床二代测序试验结果，研究者将基于cerebro的PGDx CancerSELECT 125与3种突变测试的方法进行比较。

队列1中：CancerSELECT 125, Oncomine和TruSeq分析来自22个肺肿瘤的冰冻或者石蜡切片重复肿瘤样本，因为其中有3个样本DNA含量不够，故在分析过程中去除；每一个样本的临近散布组织用同样的方法进行分析。

金标准：至少2种方法结果提示为突变，或者1种方法提示为突变， ddPCR证实其存在突变。金标准结果：30个SBS，6个插入或缺失

结果分析：使用cerebro的CancerSELECT 125 panel获得100%敏感性和阳性预测值，表现优于oncomine和truseq。Oncomine assay 中检测SBSs和indel的敏感性分别为97% 和 83%。其中2个CS125检测出而Oncomine 未能识别的突变，使用ddPCR 进行证实。TruSeq panel 未能检测出15 SBSs 和 3个indels，SBSs和indel的敏感性均为50%。

CancerSELECT 125、Oncomine和TruSeq分别是0, 17和 175 假阳性。Oncomine or TruSeq panels 检测出的17个假阳性经胚系突变数据库证实为单核苷酸多态性，但是cerebro未把它们识别为体细胞突变。TruSeq panel的阳性预测值仅为8%，其中大量的假阳性提示有技术的原因，包括PCR伪像、测序错误。使用CancerSELECT 125 和 Oncomine平台对NGS数据中的候选突变点进行详细的评价，并没有找到突变的相应证据。