
DRUGONE
RNA药物的兴起主要得益于脂质纳米颗粒(LNPs)。LNP的有效性取决于其脂质成分及其比例,但实验优化过程十分繁琐且无法覆盖完整的设计空间。研究人员提出了一种深度学习方法,能够整合LNP的多组分与多模态特征,并以端到端方式预测其性能。研究人员建立了目前最大的LNP数据集之一(LANCE),并据此训练了深度学习模型——COMET。这一基于Transformer的神经网络不仅能准确预测LNP的转染效率,还能够扩展到非常规配方,如双可电离脂质和聚合物材料。COMET还能在外部细胞系中预测LNP性能,并在小规模训练数据下预测LNP冻干过程中的稳定性。实验验证表明,COMET能够识别出在体内外均表现出较强蛋白表达的LNP,加速了核酸治疗药物的开发,并展现出在治疗与制造领域的广阔应用潜力。

药物研发过程中,大多数活性成分需要与多种辅料共同配制成药物制剂,平均每种制剂包含约八种辅料。成分与比例的多样性使得配方设计的搜索空间极其庞大,即使是高通量筛选手段也难以应对复杂度的指数级增长。
深度学习作为能够处理多因素数据的人工智能方法,在药物发现与材料科学中已取得广泛应用。然而,其在多组分药物制剂中的应用仍十分有限。RNA类脂质纳米颗粒是极具前景的药物递送载体,其成功应用于新冠疫苗进一步凸显了其重要性。LNP由四类脂质组成,每一类都对RNA递送至关重要,其功能不仅依赖于脂质的化学结构,还取决于它们之间的摩尔比例。这意味着在不同应用场景下,配方需要重新优化。
已有部分研究尝试将机器学习引入药物递送领域,但大多关注单一分子(如可电离脂质)的结构特征。这些方法虽能发现新的候选脂质,却无法全面揭示LNP整体配方的规律,也未能充分利用实验产生的原始数据。因此,研究人员提出了一种能够同时表示完整配方并具备跨场景泛化能力的深度学习框架。
结果
LNP设计与COMET模型
COMET将脂质分子结构、摩尔百分比以及配方参数(如氮/磷比、混合比例)转化为模型输入。模型采用类似语言模型的Transformer结构,把每一类成分及配方参数视为离散“词元”,通过自注意力机制整合信息并生成整体预测。与传统回归不同,COMET使用排序学习目标来提升对转染效率的区分能力,并辅以噪声增强、梯度对齐和集成学习等策略以增强鲁棒性。

LANCE数据集
为训练COMET,研究人员开发了高通量合成与检测流程,构建了LANCE数据集。该数据集包含3000余种LNP配方,覆盖不同脂质种类、合成条件和摩尔比例,转染效率以萤光素酶信号量化并归一化。
配方因素对LNP效率的影响
实验显示,可电离脂质的选择对转染效率影响显著。例如,CKK-E12和C12-200优于DLin-MC3-DMA;辅脂质(如DOPE)、甾醇类(胆固醇或β-谷甾醇)以及PEG脂质也对效率有关键作用。摩尔比例和合成条件(如水/有机相比例)在不同配方中表现出差异化效果,提示需要针对具体场景进行优化。

COMET性能评估
在随机测试集中,COMET表现出高相关性(Spearman与Pearson系数均>0.86)。在更贴近药物发现场景的“命中测试”中,COMET依然保持较强预测能力,并能以近80%的准确率将高效LNP分类到前半区。通过多任务学习和模型集成,COMET的性能进一步提升,并且在扰动实验中表现出对结构—活性关系的敏感性。

虚拟筛选与实验验证
研究人员利用COMET在5000万种虚拟配方中筛选候选,并在体外实验中验证。结果表明,所有计算预测的候选均优于已获批的临床LNP,其中部分在小鼠体内表现出显著更强的蛋白表达能力。
适应新材料与新细胞类型
COMET被扩展至聚合物LNP(PBAE类),即使训练样本有限,也能取得良好预测效果,并成功优化出高效的新型聚合物-LNP配方。此外,研究人员还在人体Caco-2细胞和HepG2细胞中测试了COMET,结果显示其具备跨细胞类型和不同mRNA载荷的适应性。

稳定性预测
在冻干稳定性任务中,COMET能够预测LNP在冻干后效能的损失,并通过多任务学习获得更高准确性。这为LNP在实际生产与储存中的稳定性优化提供了可行路径。

讨论与结论
研究人员提出的COMET模型不仅强调单一成分的分子结构,更突出成分间的相互作用及其比例的重要性。该框架整合多模态特征,在无需人工选择理化参数的情况下,能够以数据驱动方式学习LNP配方规律。
与传统方法相比,COMET在区分高效与低效配方时表现突出,尤其是在面对非典型配方(如双可电离脂质、聚合物-脂质混合物)时展现出更强的泛化能力。它能够在大规模虚拟化学空间中挖掘新型候选,为LNP设计提供了高效途径。
在优化任务中,COMET在多数情况下能提出优于原始配方的新方案。然而,当原始配方本身已接近最优时,进一步改进仍具挑战。这提示未来可结合主动学习与高性能数据积累,提升对高效区域的判别能力。
总体而言,COMET不仅能够预测体外效率,还能部分解决跨细胞类型与稳定性的问题。它的多任务与可扩展特性使其适用于更广泛的纳米技术应用,包括多重药物递送、免疫调节纳米颗粒设计与组织工程材料研发。未来,随着高通量实验方法的发展与更大规模数据的积累,COMET有望成为药物制剂研发和知识发现的重要工具。
整理 | DrugOne团队
参考资料
Chan, A., Kirtane, A.R., Qu, Q.R. et al. Designing lipid nanoparticles using a transformer-based neural network. Nat. Nanotechnol. (2025).
https://doi.org/10.1038/s41565-025-01975-4
内容为【DrugOne】公众号原创|转载请注明来源