首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | 突破传统!全原子扩散模型开启蛋白质序列设计新维度

AI+Drug 文献速递 | 突破传统!全原子扩散模型开启蛋白质序列设计新维度

作者头像
MindDance
发布2026-01-08 12:52:10
发布2026-01-08 12:52:10
1570
举报

1. All-Atom Protein Sequence Design using Discrete Diffusion Models

期刊: bioRxiv 链接: https://doi.org/10.1101/2025.06.13.659451 代码: https://github.com/Intelligent-molecular-systems/All-Atom-Protein-Sequence-Generation

简介: 该论文提出了一种基于离散扩散模型的全原子蛋白质序列设计方法,利用SELFIES全原子化学表示来生成包含非规范氨基酸和翻译后修饰的新型蛋白质序列,拓展了传统仅基于20种规范氨基酸的序列表示局限。研究采用修改后的ByteNet架构,在离散扩散D3PM框架内,评估了全原子表示对蛋白质质量、多样性和新颖性的影响,并开发了综合评估流程以确定生成的SELFIES序列能否转化为包含规范和非规范氨基酸的有效蛋白质。实验在UniRef50数据集上训练模型,对比了均匀噪声和吸收噪声两种扩散过程中的噪声调度影响,结果表明全原子表示生成的成功蛋白质具有更高的新颖性和多样性,结构可折叠性结果与基于氨基酸的模型相当,且吸收噪声调度效果更优。该工作为蛋白质设计中全原子表示在离散扩散模型中的应用提供了新思路。


2. DiffER: Categorical Diffusion Models for Chemical Retrosynthesis

期刊: arXiv 链接: https://arxiv.org/abs/2505.23721 代码: https://github.com/sfcurre/DiffER

简介: 论文提出了DiffER,一种无模板的分类扩散模型用于化学逆合成预测,通过分类扩散允许整个输出SMILES序列同步预测,构建的扩散模型 ensemble 在top-1准确率上达到 state-of-the-art,在top-3、top-5和top-10准确率上与无模板方法相当。该方法引入了一种新的长度预测组件,结合方差估计输出序列长度,通过集成多个不同随机填充限制的扩散模型,对生成的反应物进行规范排名。实验在USPTO-50K数据集上进行,结果显示DiffER在单步逆合成预测中表现出色,且通过案例研究表明其能学习实验室中使用的各种合成技术,但在输出多样性上存在一定限制。DiffER为逆合成预测提供了一种新的无模板方法基线。


3. DualEquiNet: A Dual-Space Hierarchical Equivariant Network for Large Biomolecules

期刊: arXiv 链接: https://arxiv.org/abs/2506.19862

简介: 论文提出DualEquiNet,一种双空间层次等变网络,用于大型生物分子建模,通过在欧几里得和球谐函数空间构建互补表示,捕捉局部几何和全局对称性特征,结合双向跨空间消息传递和跨空间交互池化机制,实现从原子到残基的层次化特征聚合。该模型在RNA属性预测、蛋白质建模等多个现有基准上取得state-of-the-art性能,并在新引入的两个3D结构基准(溶剂可及表面积预测和扭转角预测)上优于先前方法。实验使用CovidVaccine、Ribonanza等数据集,验证了模型在捕捉长距离依赖和多尺度结构方面的有效性,为大型生物分子建模提供了高效且富有表现力的框架。


4. Multimodal Representation Learning and Fusion

期刊: arXiv 链接: https://arxiv.org/abs/2506.20494

简介: 该论文聚焦于多模态表示学习与融合,要点在于提出递归成本引导、开发动态库机制及利用剥削惩罚平衡探索与利用,以解决模板分子生成中合成成本高、库规模大及碎片集小等挑战。方法上,通过P2Rank预测蛋白口袋中心,结合QuickVina 2-GPU 2.1进行多口袋条件对接,还引入辅助机器学习模型近似合成成本与可行性。实验在PDBbind2020、DockGen等多个基准数据集上展开,结果显示其在物理有效对接姿势采样上表现优异,在TargetDock-AI数据集上也能有效区分活性与非活性药物-靶点对。该论文为多模态学习领域提供了可扩展且高效的解决方案,推动了多模态模型在实际应用中的发展。


5. Scalable and Cost-Efficient de Novo Template-Based Molecular Generation

期刊: arXiv 链接: https://arxiv.org/abs/2506.19865 代码: https://github.com/koziarskilab/SCENT

简介: 论文提出SCENT框架,旨在解决模板分子生成中的合成成本、库扩展及碎片集利用问题,创新点在于结合递归成本引导、动态库机制和剥削惩罚策略。方法上,先通过P2Rank预测口袋中心,再用QuickVina 2-GPU 2.1进行多口袋对接,利用机器学习模型引导生成低成本路径。实验在PDBbind2020、Astex等数据集上验证,结果表明SCENT在合成成本、分子多样性等方面优于传统和深度学习方法,尤其在未见过的靶点上表现突出。该研究为模板分子生成提供了高效且经济的解决方案,适用于高通量虚拟筛选。


6. PocketVina Enables Scalable and Highly Accurate Physically Valid Docking through Multi-Pocket Conditioning

期刊: arXiv 链接: https://arxiv.org/abs/2506.20043 代码: https://github.com/BIMSBbioinfo/PocketVina

简介: 论文介绍PocketVina框架,通过多口袋条件对接实现可扩展且高物理有效性的分子对接,创新在于结合口袋预测与系统多口袋探索。方法是利用P2Rank预测口袋中心,配合QuickVina 2-GPU 2.1进行对接,无需特定任务训练。实验在PDBbind2020、DockGen等基准及新创的TargetDock-AI数据集上进行,结果显示其在物理有效对接和区分活性/非活性靶点上表现优异,且内存需求低、运行高效。该研究为结构药物发现提供了可靠的对接工具,适用于高通量虚拟筛选。


7. A Deep-Learning-Aided Drug Screening Based on Visualization of a Hidden Layer as Chemical Space

期刊: ACS Medicinal Chemistry Letters 链接: https://doi.org/10.1021/acsmedchemlett.5c00124

简介: 论文提出一种基于图卷积网络隐藏层可视化的深度学习辅助药物筛选方法,能从深度学习模型预测的候选化合物中优先选择实验测试化合物,并提供化合物结构与活性关系信息。该方法构建GCN深度学习模型,将隐藏层输出可视化为化学空间,通过在化学空间中靠近已知活性化合物来筛选新化合物。实验利用ChEMBL数据集训练模型,在Drug Discovery Initiative库中筛选出40个虚拟命中化合物,其中4个具有HDAC1抑制活性,且与参考化合物结构差异大。该研究为药物发现提供了高效的深度学习辅助筛选策略,有助于发现新的药物先导化合物。


8. Deciphering Cell Type Abundance in Proteomics Data Through Graph Neural Networks

期刊: Advanced Science 链接: https://doi.org/10.1002/advs.202502987

简介: 论文提出GraphDEC方法,通过图神经网络解读蛋白质组学数据中的细胞类型丰度,解决现有方法在蛋白质组学应用中因转录组与蛋白质组相关性弱及忽略样本高阶关系导致的性能局限。该方法利用自监督学习和图神经网络,构建包含原子键、键角和二面角信息的增强几何图神经网络,结合多尺度自监督任务。实验在多个合成蛋白质组学数据集和真实空间蛋白质组学数据集上进行,结果显示GraphDEC在12个任务中表现最优,且在跨物种和转录组数据中具有良好泛化能力。GraphDEC为蛋白质组学数据的细胞类型解卷积提供了有效解决方案,推动相关研究进展。


9. Q-GEM: Quantum Chemistry Knowledge Fusion Geometry-Enhanced Molecular Representation for Property Prediction

期刊: Advanced Science 链接: https://doi.org/10.1002/advs.202504867 代码: https://github.com/kotoriy/PaddleHelix-GEM-Improved/tree/gem-advanced/apps/pretrained_compound/ChemRL/GEM

简介: 论文提出Q-GEM方法,融合量子化学知识和几何结构增强的分子表示用于性质预测,解决现有方法对分子三维结构和电子结构信息表征不足的问题。该方法构建嵌入分子电子和完整三维几何结构信息的图神经网络,结合多尺度自监督任务。实验在MoleculeNet数据集和QuanDB数据集上进行,Q-GEM在13个预测任务中的12个表现最优,量子化学性质预测误差平均降低5.2%。Q-GEM为准确的分子性质预测提供了新的有力方法,对药物发现和材料科学等领域具有重要意义。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. All-Atom Protein Sequence Design using Discrete Diffusion Models
  • 2. DiffER: Categorical Diffusion Models for Chemical Retrosynthesis
  • 3. DualEquiNet: A Dual-Space Hierarchical Equivariant Network for Large Biomolecules
  • 4. Multimodal Representation Learning and Fusion
  • 5. Scalable and Cost-Efficient de Novo Template-Based Molecular Generation
  • 6. PocketVina Enables Scalable and Highly Accurate Physically Valid Docking through Multi-Pocket Conditioning
  • 7. A Deep-Learning-Aided Drug Screening Based on Visualization of a Hidden Layer as Chemical Space
  • 8. Deciphering Cell Type Abundance in Proteomics Data Through Graph Neural Networks
  • 9. Q-GEM: Quantum Chemistry Knowledge Fusion Geometry-Enhanced Molecular Representation for Property Prediction
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档