
DRUGONE
表型驱动的方法通过分析疾病与健康状态之间的表型特征差异来识别能够对抗疾病的化合物。研究人员在此提出了 PDGrapher,一种因果启发的图神经网络模型,用于预测能够逆转疾病表型的组合干预(即一组治疗靶点)。与那些学习“干预如何改变表型”的方法不同,PDGrapher解决了反向问题:预测需要哪些干预来实现期望的反应。其方法是将疾病细胞状态嵌入网络,学习这些状态的潜在表示,并识别最优的干预组合。在九种细胞系的化学干预实验中,PDGrapher能在更多测试样本中发现有效干预组合,且在十个基因干预数据集中也表现出竞争力。相比间接且计算密集的表型驱动模型,PDGrapher直接进行预测,训练速度可快达 25 倍。这为快速识别治疗干预、推动表型驱动的药物发现提供了新途径。

自 1990 年代以来,占主导地位的靶点驱动型药物发现主要集中在设计高度特异性的化合物,以作用于与疾病相关的蛋白或酶。其代表案例包括酪氨酸激酶抑制剂伊马替尼(用于慢性髓性白血病)以及单克隆抗体曲妥珠单抗(用于 HER2 阳性乳腺癌)。这些成功案例说明了靶点驱动方法的价值,但近十年来,表型驱动方法重新兴起。驱动因素在于大量获批的一类新药并没有预设靶点假说,而是依赖表型筛选。与“一个药物-一个基因-一个疾病”的模式不同,表型驱动药物发现强调寻找能够逆转疾病表型的化合物或更广泛的“干预组合”。
表型驱动研究的推进离不开化学和遗传学干预大规模资源,如 Connectivity Map(CMap)与 LINCS 项目。这些数据库包含了细胞在成千上万种基因和化学干预下的转录组信息。传统的深度学习方法大多预测细胞对干预的响应,但它们局限于既有的化合物库,无法发现新的靶点组合。与此不同,因果推理中的“最优干预设计”提供了一条新思路:通过因果图和几何深度学习,直接预测能够将疾病状态转化为健康状态的靶点集合。基于此,研究人员提出了 PDGrapher。
结果
干预数据集与因果图概览
研究人员在 38 个经过预处理的数据集上对方法进行了评估,涵盖基因干预与化学干预两类,共涉及 11 种癌症类型与两类代理因果图(蛋白互作网络和基因调控网络)。这些数据集使得模型在不同生物学情境和图结构下都能得到系统验证。
PDGrapher 模型概述
PDGrapher 的目标是预测一组基因靶点,使得细胞从疾病状态转变为治疗状态。它由两个模块组成:
二者均基于图神经网络,并在训练中通过循环损失和监督损失共同优化。最终,模型能直接预测逆转疾病所需的靶点集合,而非间接依赖响应预测。


PDGrapher 能够逆转疾病状态
在九个化学干预数据集上,PDGrapher 在排名指标(nDCG)、召回率(recall@1, @10, @100)及实际靶点恢复率上均优于对照方法。例如,在乳腺癌细胞系 MDAMB231 上,PDGrapher 在测试集中比次优方法多恢复 13.37% 的真实靶点。在基因干预数据集上,尽管整体信号较弱,PDGrapher 仍在组合预测任务中表现出相对优势。

对未见过的细胞系的泛化能力
在“跨细胞系验证”中,PDGrapher 在 9 个化学干预数据集中的 8 个中优于现有方法,表现出良好的泛化能力。与需要为每个干预单独训练模型的方法不同,PDGrapher 的计算效率极高,训练速度比 CellOT 和 scGen 快一个数量级以上。

临床与生物学证据支持的靶点预测
PDGrapher 还能够识别临床和生物学上已有证据支持的治疗靶点。例如,在肺癌数据中,模型成功预测了 VEGFR2(KDR)作为潜在关键靶点,并关联到索拉非尼、凡德他尼等抗癌药物。进一步的案例研究表明,PDGrapher 预测的高排名基因更可能得到外部数据库(如 Open Targets)的支持,验证了模型预测的可靠性。

消融实验与鲁棒性分析
研究人员进行了目标函数与输入数据的消融实验,结果表明:监督损失对于靶点预测至关重要,而循环损失则提升了模型在“重建治疗样本”上的性能。最终采用的 SuperCycle 配置在预测准确性与生物学合理性之间实现了平衡。此外,模型在不同置信度的 PPI 网络上均保持稳定表现,显示出对因果图结构扰动的鲁棒性。

讨论
本研究提出的 PDGrapher 模型,将因果推理与图神经网络结合,直接预测能够逆转疾病表型的靶点组合。这一方法不仅在化学和基因干预数据中优于现有模型,还展示了显著的计算效率和良好的泛化能力。通过结合临床与生物学证据的验证,PDGrapher 在药物发现中的潜力得到进一步印证。
尽管在基因干预数据上的性能仍有限,但这可能与基因敲除信号较弱、存在补偿机制等生物学因素相关。未来的研究可以探索如何融合多模态数据(如表观遗传、代谢组学)来增强预测能力。同时,PDGrapher 的框架为大规模表型驱动药物发现提供了可扩展途径,尤其适合于组合干预的设计与验证。
整理 | DrugOne团队
参考资料
Gonzalez, G., Lin, X., Herath, I. et al. Combinatorial prediction of therapeutic perturbations using causally inspired neural networks. Nat. Biomed. Eng (2025).
https://doi.org/10.1038/s41551-025-01481-x
内容为【DrugOne】公众号原创|转载请注明来源