
期刊: Commun. Chem. 链接: https://www.nature.com/articles/s42004-025-01586-z 代码: https://github.com/zhengyjo/MMFRL 简介: 该论文提出了 MMFRL(Multimodal Fusion with Relational Learning)框架,旨在解决分子性质预测中现有方法难以捕捉复杂分子关系、多模态融合阶段不明确及辅助模态数据缺失的问题,其创新点在于通过关系学习丰富嵌入初始化并系统探索多模态融合阶段。该框架利用改进的关系学习(MRL)将成对自相似性转化为相对相似性,结合早期、中期和后期三种多模态融合策略,并通过预训练多个 GNN 副本实现跨模态知识迁移。实验在 MoleculeNet 的 11 个基准数据集(包括 BBBP、BACE 等 8 个分类任务和 ESOL 等 3 个回归任务)上进行,结果显示 MMFRL 在预测准确性和鲁棒性上显著优于现有方法,且增强了模型的可解释性,为药物发现和材料科学的实际应用提供了有价值的见解。

在计算生物物理与人工智能交叉领域,分子性质预测模型的性能瓶颈始终制约着药物研发的效率跃迁。传统图神经网络(GNN)虽能编码分子拓扑结构,但在处理立体化学差异、跨模态信息整合等关键问题上存在固有局限。近期《Communications Chemistry》发表的《Multimodal fusion with relational learning for molecular property prediction》一文提出的MMFRL框架,通过系统性的方法论创新,为解决这些核心难题提供了可验证的技术路径,值得领域内研究者重点关注。
当前分子表示学习面临的双重挑战亟需突破:
在关系建模层面,主流对比学习方法存在显著局限。现有CL策略多采用二元标签定义正负样本对,这种离散化处理难以捕捉分子间连续的相似性梯度。典型如沙利度胺的手性异构体,其拓扑结构完全一致仅立体构型不同,却呈现截然相反的生物活性,传统方法因无法编码这种精细关系而导致预测偏差。更关键的是,大多数研究局限于单一模态内的相似性学习,忽视了不同分子表征(如2D拓扑与3D构象)间的关联性挖掘。
多模态融合的实践困境同样突出。现有研究存在三重矛盾:一是模态覆盖不全,多数方法仅整合2-3种分子表征,遗漏了电子密度、分子轨道等关键化学信息;二是融合时机缺乏理论支撑,早期/中期/后期融合的选择依赖经验判断,缺乏系统性比较;三是模态数据依赖性强,预训练阶段的多模态优势在下游任务缺少特定模态数据时无法转化,形成"预训练-微调"的数据断层。
MMFRL框架通过关系学习范式革新、融合策略优化和知识迁移机制构建,形成完整技术闭环:

MMFRL框架图。该图展示了如何迁移单一模态的知识并通过融合进一步提升性能。MMFRL 无需定义正负样本对,能够从目标相似性中学习连续排序。
改进的关系学习(MRL)模块实现了分子相似性建模的范式转换。不同于传统对比学习需要人工定义正负样本边界,MRL通过连续度量学习构建相对相似性矩阵,将分子对之间的自相似性转化为三元组比较任务。其核心损失函数设计实现了目标相似性与潜在空间相似性的数学对齐,在理论上证明了最优状态下softmax输出与目标分布的一致性,为模型收敛提供了严格的理论保障。这种设计使模型能自动捕捉从拓扑相似到立体化学差异的全谱关系,尤其对构象敏感型分子性质预测具有突破性意义。
多模态融合策略的系统研究建立了科学选择依据。框架创新性地对比了三种融合范式的适用场景:早期融合通过预训练阶段的特征拼接实现多模态聚合,虽计算高效但依赖固定权重分配,在模态相关性动态变化的场景表现受限;中期融合在微调阶段通过多层感知机(MLP)动态整合各模态编码特征,能够自适应学习互补信息权重,在7项基准任务中展现最优性能;后期融合采用预测结果加权融合策略,在单一模态占主导的任务(如脂溶性预测)中表现更佳。这种基于数据驱动的策略选择指南,解决了领域内融合策略选择的盲目性问题。
跨模态知识迁移机制破解了模态数据不全的行业痛点。通过构建模态专属GNN编码器副本,预训练阶段实现的跨模态关联知识被存储于模型参数中。当下游任务缺失特定模态数据时,模型可通过参数共享机制调用相关模态的迁移知识,实验证明这种机制使缺少3D模态的下游任务仍能保持85%以上的性能保留率,显著优于传统单模态微调方法。
在MoleculeNet基准测试的严格验证中,MMFRL展现出压倒性优势:
分类任务中,中期融合策略在BBBP(血脑屏障穿透性)、Bace(β-分泌酶抑制)等7个数据集上实现ROC-AUC指标的全面领先,其中Clintox任务较最佳基线提升3.2%,Tox21任务提升2.8%。尤其值得注意的是,在仅含2D结构数据的下游任务中,经多模态预训练的模型仍能超越专用2D模型,验证了跨模态迁移的有效性。

分类下游任务的整体性能(ROC-AUC)表。对比了 AttentiveFP、DMPNN、MMFRL(早期、中期、后期融合)等模型在 BBBP、Bace 等 8 个数据集上的性能,最佳结果用粗体标注,第二佳结果用下划线标注。对于 MMFRL 的早期融合,各模态的预定义权重均为 0.2。
回归任务上,中期融合在ESOL(水溶性预测)中达到0.730的RMSE,较基线降低12.3%;FreeSolv(水合自由能)任务RMSE 1.465,保持预测误差在化学意义显著范围内。后期融合在Lipo(脂溶性)任务中以0.525的RMSE夺冠,证明了策略选择的科学性。

ESOL 任务中各模态嵌入与中期融合嵌入的相似性分布图。在余弦相似度和点积两种度量下,各模态嵌入与中期融合表示的相似度均较低,表明各模态相互补充,共同提升了中期融合嵌入的表示效果。

ESOL 任务中各模态嵌入与中期融合嵌入的相似性分布图。在余弦相似度和点积两种度量下,各模态嵌入与中期融合表示的相似度均较低,表明各模态相互补充,共同提升了中期融合嵌入的表示效果。

Lipo 后期融合贡献分析图。结果显示三个主要贡献者为 SMILES、图像和 NMRₚₑₐₖ,而 NMR 光谱和指纹的贡献可忽略不计。
模型可解释性的增强是另一重要突破。通过t-SNE可视化发现,中期融合产生的分子嵌入空间呈现清晰的性质梯度分布,ESOL数据集中分子按溶解度大小形成连续分布簇,直观反映定量构效关系(QSAR)。子结构重要性分析(MPS)精准识别出BACE抑制剂中的关键药效团:吡唑环的N-H键与靶蛋白Asp228的氢键作用(贡献度17.3%)、三氟甲氧基的疏水相互作用(贡献度12.6%),这些发现与已知晶体结构分析高度吻合,为药物设计提供了可操作的结构优化方向。

SOL 分子嵌入的 t-SNE 可视化图。图中每个点对应 ESOL 中的分子嵌入,颜色表示溶解度水平(红色表示较高溶解度,蓝色表示较低溶解度)。单一模态的嵌入未显示清晰模式,而中期融合的嵌入形成从左下(较低溶解度)到上中(较高溶解度)的梯度,体现了中期融合在捕捉水溶性定量构效关系方面的有效性。

左侧子图为前 8 个最常见的最小正子图(MPS)对应的分子组的结合差异箱线图;右侧子图展示了第 5 个 MPS 的详细结构。
MMFRL的实用价值体现在三个维度:数据适应性方面,通过模态缺失模拟实验证明,即使50%模态数据缺失,模型仍能保持90%以上的核心性能;策略灵活性上,建立的模态相关性-Pearson增益对照表可直接指导实际应用中的策略选择;领域扩展性方面,在DUD-E虚拟筛选数据集上的富集因子(EF1%)达到28.7,远超传统方法的19.3,显示出在药物筛选领域的应用潜力。
该研究的学术启示更为深远:其提出的相对相似性学习框架可推广至所有需要度量学习的场景;多模态融合策略的系统比较为跨模态研究提供了方法论参考;而跨模态知识迁移机制则为解决现实世界中的数据不全问题提供了新范式。开源代码(https://github.com/zhengyjo/MMFRL)提供的完整实现,包括模态预处理工具、融合策略API和可解释性分析模块,降低了方法应用的技术门槛。
MMFRL框架仍有广阔的拓展空间:节点级与图级相似性的整合有望进一步提升模型对局部结构的敏感性;引入量子化学计算模态可增强对电子效应的建模能力;而将该框架迁移至材料发现领域,有望加速新型能源材料的研发进程。对于从事AI驱动药物研发的研究者而言,深入理解MMFRL的设计理念,不仅能提升模型性能,更能为解决跨模态学习的共性问题提供宝贵借鉴。
(●'◡'●) 需要进一步讨论的同学欢迎留言交流!