首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Adv. Sci. | ALLSites: 基于序列的蛋白质全模态药物结合位点预测框架

Adv. Sci. | ALLSites: 基于序列的蛋白质全模态药物结合位点预测框架

作者头像
DrugOne
发布2026-01-13 15:40:15
发布2026-01-13 15:40:15
2270
举报
文章被收录于专栏:DrugOneDrugOne

研究背景

蛋白质通过与多种分子模态相互作用在细胞过程中发挥着关键作用。然而,由于结合位点鉴定的不完整,全蛋白质组的成药性在很大程度上仍未被充分探索。尽管小分子药物是最常见的药物形式,但它们只能调节不到15%的人类蛋白质组。研究人员开始探索其他新型药物模态,包括基于蛋白质、多肽、核酸和糖分子的治疗策略,以调控蛋白质功能。因此,全面鉴定各类药物模态的蛋白质结合位点具有重要意义,能够将某一种药物模态下的“难成药靶标”重新定义为另一种模态下的“可成药靶标”,从而显著拓展全蛋白组的可药靶性。然而,药物模态的多样性与复杂性给实验方法鉴定蛋白质结合位点带来了巨大挑战。为此,有大量研究致力于开发能够预测各种药物模态结合位点的计算方法。

目前的计算方法面临着三大挑战:(1)大多数方法仅针对单一药物模态设计,缺乏通用性;(2)基于结构的方法严重依赖高质量的三维结构数据,而实验解析的蛋白质结构覆盖率不足;(3)基于序列的方法虽然适用性更广,但忽略了残基间相互作用信息,预测准确性往往不尽如人意。因此,开发一种能够准确识别全蛋白质组范围内所有药物模态结合位点的通用方法,对于扩展可成药蛋白质组、加速药物发现进程具有重要意义。

研究亮点

浙江大学团队在Advanced Science上发表了题为“Accurate Identification of Protein Binding Sites for All Drug Modalities Using ALLSites”的研究论文。该研究构建了一种统一的、基于蛋白质序列的深度学习框架ALLSites,实现了对蛋白质、多肽、小分子、糖分子、DNA和RNA等主要药物模态结合位点的准确预测。

ALLSites的核心创新在于:它是一种支持所有主要药物模态结合位点预测的统一框架,仅需蛋白质序列信息即可工作,无需依赖难以获取的高质量三维结构。更重要的是,ALLSites在所有基于序列的方法中达到了先进的性能水平,甚至可以与最佳的基于结构的方法相媲美。在实际应用中,ALLSites展现出极高的效率,可以在16小时内完成整个人类蛋白质组的扫描,为全蛋白质组可成药位点发现提供了强大工具。

技术方法

ALLSites采用基于Transformer的深度学习架构,将蛋白质语言模型与门控卷积网络、交叉注意力机制相结合。整个框架包含三个关键模块协同工作。

图1:ALLSites模型框架。

模块一:蛋白质特征编码器模块。选用了预训练的ESM-2语言模型来生成残基级别的表示。这个拥有30亿参数的大模型能够捕获丰富的进化信息和复杂的序列模式。编码器进一步集成了门控卷积网络,通过多层卷积操作提取每个残基的局部上下文特征,并将这些局部特征整合形成全局序列表示。

模块二:交叉注意力解码器模块。这是ALLSites能够从序列直接建模残基相互作用的关键。解码器采用改进的Transformer架构,通过多头交叉注意力机制,让每个残基都能关注到蛋白质中其他残基的信息。这种设计使得模型能够在没有三维结构的情况下,仅从序列就能学习到残基之间的空间相互作用模式,从而弥合了序列方法和结构方法之间的性能差距。

模块三:由多层全连接网络组成的分类模块。该模块将解码器输出的特征映射为每个残基作为不同药物模态结合位点的概率。研究团队针对每种药物模态分别训练了专门的模型,确保了预测的准确性和特异性。

性能比较

蛋白质和多肽结合位点预测表现优异

在蛋白质-蛋白质相互作用位点预测任务中,ALLSites展现出了显著优势。在PPI-Test70数据集上,ALLSites的AUROC达到0.755,比第二名的EnsemPPIS提升了5.0%;AUPRC达到0.438,提升幅度达到8.1%;关键的MCC指标也提升了0.042。在另一个更大规模的PPI-Test355数据集上,改进幅度更加明显,AUROC提升6.9%,AUPRC提升高达24.6%,MCC提升0.096。

研究团队还进行了蛋白质水平的精细化分析。在PPI-Test315数据集的315个蛋白质中,ALLSites在73.7%的蛋白质上取得了比EnsemPPIS更高的MCC分数。以一个具体案例(PDB ID: 6G4JB)为例,ALLSites预测的MCC达到0.834,而EnsemPPIS仅为0.425,预测的结合位点也更接近实验结果,降低了预测结果的假阳性和假阴性。

图2:ALLSites对于蛋白质和多肽结合位点上的预测性能。

小分子和糖分子结合位点预测准确

对于最常见的小分子药物,ALLSites与知名的基于结构的方法P2Rank进行了对比。结果显示,ALLSites在所有评估指标上都优于P2Rank。F1分数达到0.601,提升了0.151;MCC为0.560,提升了0.136;召回率为0.593,提升了0.232。在蛋白质水平的分析中,ALLSites在66.4%的案例中表现更优。值得关注的是,ALLSites在不使用任何结构信息的情况下,就超越了专门利用结构特征的P2Rank,这证明了ALLSites从序列中提取关键特征和建模残基相互作用的强大能力。

糖分子是一类特殊的小分子,具有独特的化学性质,其结合位点与典型小分子存在本质差异。ALLSites在糖分子结合位点预测中展现出了对这种特殊性的良好适应能力。与三种结构方法FTMap、CAPSIF:V和CAPSIF:G相比,ALLSites在所有评估指标上都取得了最佳表现。相比通用小分子工具FTMap,平均DICE和MCC指标分别提升了0.258和0.381,这进一步证实了糖分子结合位点确实不同于常规小分子结合位点,需要专门的预测工具。

图3:ALLSites对于小分子和糖分子结合位点的预测性能。

核酸结合位点预测准确可靠

在DNA结合位点预测任务中,ALLSites在两个独立测试集DPI-Test129和DPI-Test181上的性能超越了所有基于序列的方法。与当前最佳的结构方法GraphBind相比,ALLSites的AUROC表现相当,MCC略低但差距很小。考虑到ALLSites完全不依赖结构信息,这样的表现已经相当出色。

RNA结合位点的预测结果也展现出类似的模式。在RPI-Test117数据集上,ALLSites的AUROC和MCC均排名第二,AUROC值与最佳结构方法GraphBind几乎持平。这些结果充分说明,ALLSites能够仅从序列信息就准确识别核酸结合位点。

图4:ALLSites对于DNA和RNA结合位点的预测性能。

结构预测的局限性凸显ALLSites优势

研究团队还评估了当使用AlphaFold2预测的结构代替实验解析结构时,基于结构的方法GraphBind的性能变化。结果显示,在DPI-Test129数据集上,使用预测结构后,GraphBind的AUROC和AUPRC都降到了ALLSites之下;在DPI-Test181上,所有三个关键指标都低于ALLSites。

这个发现揭示了一个重要事实:尽管AlphaFold2等结构预测工具取得了巨大进步,但预测结构与真实结构之间仍存在偏差,而结构方法对这些偏差高度敏感。相比之下,ALLSites直接从序列学习,不受结构误差影响,在处理缺乏实验结构的蛋白质时具有明显优势。考虑到只有不到35%的人类蛋白质有实验解析的晶体结构,ALLSites的这一特性使其能够实现全蛋白质组范围的应用。

研究意义与展望

ALLSites的开发为蛋白质-配体相互作用预测领域带来了重要突破。这是能够跨所有主要药物模态进行准确预测的统一框架,克服了以往方法局限于单一模态的束缚。

从方法学角度,ALLSites实现了仅从序列信息就能有效建模残基间的相互作用。通过编码器-解码器架构和交叉注意力机制,ALLSites成功弥合了序列方法和结构方法之间的性能差距,在不使用结构信息的情况下达到了与结构方法相媲美的预测准确度。

在实际应用层面,ALLSites展现出了强大的全蛋白质组应用潜力。它能在16小时内完成整个人类蛋白质组的扫描,平均每个蛋白质仅需约3秒。这种高效率使得全蛋白质组范围的系统性可成药位点识别成为可能。更重要的是,ALLSites可以帮助研究人员重新评估那些在某一药物模态下被认为“不可成药”的蛋白质,通过预测其他模态的结合位点,将它们转变为“可成药”靶点,从而大幅扩展可用的药物靶点空间。

这项工作不仅为药物发现提供了强大的计算工具,也为理解蛋白质功能多样性和成药性机制提供了新的视角,有望加速难成药靶标的药物发现。

参考资料

Minjie Mou, Mingkun Lu, Zhimeng Zhou, et al. Accurate Identification of Protein Binding Sites for All Drug Modalities Using ALLSites. Advanced Science (2025).

https://doi.org/10.1002/advs.202516530

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档