恶性肿瘤严重威胁人类生命健康。不同于传统治疗手段,肿瘤免疫疗法的核心在于增强抗肿瘤的免疫应答能力,通过激活免疫系统特异性识别清除肿瘤细胞。该过程涉及七大关键步骤(图1)。为避免靶向肿瘤杀伤环节受阻,基于肿瘤新抗原(neoantigen)的个性化疫苗成为免疫治疗的研究热点。这些新抗原是由肿瘤基因突变产生的多肽,高度个体化,免疫原性强,可有效激活T细胞应答。然而,新抗原的有效识别与设计面临多肽、HLA(human leukocyte antigen,人类白细胞抗原)、TCR(T cell receptor, T细胞受体)三元互作的高度复杂性挑战。质谱分析(mass spectrometry analysis)、生化重组分析(biochemical reconstitution analysis)等传统实验方法虽能鉴定抗原肽,但存在通量低、成本高等瓶颈。因此,开发高效的人工智能算法,从海量数据中预测具有免疫原性的多肽候选疫苗,并对其优化设计,成为突破肿瘤免疫治疗技术壁垒的关键路径。
图1. (a) 机体抗肿瘤免疫应答过程概述。 (b) 不同类型免疫细胞与靶肿瘤细胞的相互作用。(c) 多肽、HLA与TCR的多样性与结构示意图
近日,浙江大学生命科学学院的周如鸿教授在Science Bulletin上发表了题为“Integrating AI for Next-Generation Cancer Vaccine Design”的展望文章。
该文系统阐述了癌症免疫疗法中抗肿瘤免疫应答的核心机制,新抗原疫苗设计的关键挑战及人工智能驱动的解决方案。周如鸿教授结合当前人工智能算法在预测生成任务的应用,与传统理性设计的方法,探讨了如何通过多模态数据融合以及算法创新来提升个性化疫苗开发效率,推动癌症疫苗设计向智能化方向发展。
图2. (a) AI模型核心框架概述。 (b) Neoantigen Maturation (NEOM)框架图。
在人工智能算法的应用过程中,一般基于多模态输入处理预测(监督学习)和生成(无监督学习)两类任务。经过实验测定后,通过强化学习算法再次反馈优化模型参数(图2)。最后,对模型的整体性能进行分析,提高可解释性。在疫苗设计中,预测任务的目的为评估肽的免疫原性,而生成任务的重点则为提供一系列候选免疫原性肽,进一步增强免疫。
当下前沿的预测模型同时考虑多肽,HLA与TCR三体复合物信息,并引入序列与结构等多模态信息作为模型输入,预测其是否具有免疫原性。部分模型巧妙利用AlphaFold等方法并进行微调,以弥补结构数据量不足。此外,生成模型的目标已不仅局限于生成与特定HLA结合的多肽库,还更加关注如何基于一条多肽进行优化,以获得相似或更强免疫原性的多肽序列。引入现有预测模型或专家自定义的判别函数作为实时反馈,结合机器学习算法对多肽进行持续优化。同时,为弥补AI算法缺乏解释性的问题,结合传统的理性设计方法,可准确捕捉具体体系的相互作用与动力学信息,通过精准的自由能微扰等能量突变预测算法,为肿瘤疫苗设计提供深入洞见。
当抗原与 HLA 分子结合时,患者自身 T细胞能否识别的关键在于 pHLA 复合物的结构,尤其是接触表面的变化程度。pHLA 表面与 TCR 识别模式的匹配起着核心作用。如果 pHLA 复合物表面与已知的TCR 识别模式足够 “相似”,T 细胞就更有可能被激活。这种“相似性”涵盖多维度的特征,包括肽序列、原子空间分布、结合亲和力、pHLA 表面的静电和疏水性分布等等。相似度越高,pHLA 表面就越接近 TCR 识别模式,从而增强 T 细胞的活化。该角度将引领多模态生成模型或多目标优化模型的全新的设计。通过定制化损失函数来量化pHLA表面与TCR识别模式的匹配度,并借助Alphafold3以及分子动力学模拟等工具引入相互作用网络与动力学信息,将进一步增强模型的预测能力。同时,将这类全新预测模型嵌入NEOM等框架,可生成大量有效的疫苗候选肽,为癌症免疫疗法提供智能高效的解决方案。
了解详情,请阅读全文
https://doi.org/10.1016/j.scib.2025.04.044
领取专属 10元无门槛券
私享最新 技术干货