首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | TopMT-GAN是一种新型3D拓扑驱动生成模型,用于高效且多样化的基于结构的配体设计

AI+Drug 文献速递 | TopMT-GAN是一种新型3D拓扑驱动生成模型,用于高效且多样化的基于结构的配体设计

作者头像
MindDance
发布2026-01-08 12:38:08
发布2026-01-08 12:38:08
780
举报

1. TopMT-GAN: a 3D topology-driven generative model for efficient and diverse structure-based ligand design

期刊:Chem. Sci.

链接:https://pubs.rsc.org/en/Content/ArticleLanding/2025/SC/D4SC05211K

简介:本文介绍了一种名为TopMT-GAN的新型3D拓扑驱动生成模型,用于高效且多样化的基于结构的配体设计,其创新点在于通过两步策略(先生成分子拓扑再分配原子和键类型)显著提升了生成分子的多样性和效力。该方法利用生成对抗网络(GAN)结合A-star搜索和局部优化策略,在五个不同的蛋白质口袋上进行测试,使用了Enamine HTS库和PubChem数据集进行对比评估,结果显示其相比传统高通量虚拟筛选方法最高可实现46,000倍的富集效果,并在生成分子的多样性和药效方面表现优异。研究表明,TopMT-GAN在探索化学空间和加速药物发现方面具有巨大潜力。

2. Open Foundation Models in Healthcare: Challenges, Paradoxes, and Opportunities with GenAI Driven Personalized Prescription

期刊:arXiv

链接:https://www.arxiv.org/abs/2502.04356

简介:本文探讨了开源大型语言模型(LLM)和人工智能基础模型(AIFM)在医疗领域的应用潜力与挑战,创新性地提出通过检索增强生成(RAG)技术提升开源模型性能,并以个性化处方任务为案例验证其可行性。研究方法包括对现有开源医疗LLM和AIFM的全面调研及分类,并通过对比实验评估模型表现。实验基于MIMIC-III数据集,使用GPT-4、LLaMA-2等模型进行药物适应性分析,结果表明开源模型在结合RAG后性能接近专有模型。研究表明,尽管开源模型目前稍逊于专有模型,但通过技术优化可在医疗领域实现广泛应用,推动透明化和定制化发展。

3. 3DMolFormer: A Dual-channel Framework for Structure-based Drug Discovery

期刊:arXiv

链接:https://arxiv.org/abs/2502.05107v1

简介:本文提出了3DMolFormer,一种基于双通道Transformer的统一框架,用于处理蛋白质-配体对接和口袋感知的3D药物设计任务,通过利用两者之间的对偶性,解决了3D信息建模和数据稀缺的挑战。该方法采用并行序列格式表示蛋白质口袋和配体的3D复合物,设计了双通道Transformer模型来处理这种格式,并通过大规模预训练和监督学习与强化学习微调来提升性能。实验结果表明,3DMolFormer在PDBbind和CrossDocked2020数据集上均优于现有方法,特别是在结合亲和力和多目标优化成功率方面表现突出。总结而言,3DMolFormer在结构药物发现中展现了卓越的性能,成为首个同时适用于对接和药物设计的统一框架。

4. Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

期刊:arXiv

链接:https://arxiv.org/abs/2502.05151v1

简介:本文探讨了大语言模型(LLMs)在科学研究中的广泛应用,涵盖文献搜索、实验设计、文本与多模态内容生成、同行评审等多个环节,旨在加速科学发现并提升研究效率。研究通过分析现有数据集和方法,展示了LLMs在生成研究假设、自动生成科学图表、提供同行评审反馈等方面的潜力,同时也指出了模型幻觉、数据偏见等伦理问题。实验基于多个数据集(如SciMON、TOMATO-Chem等)验证了LLMs在科学任务中的表现,结果表明其能够显著提升研究效率,但仍需在透明性和责任性方面进一步完善。总结而言,LLMs为科学研究带来了新的工具和方法,但其应用需在伦理框架内进行以确保科学诚信。

5. Data-driven recursive kinetic modeling for chemical reactions

期刊:ChemRxiv

链接:https://chemrxiv.org/engage/chemrxiv/article-details/67a5d8f381d2151a027d453f

简介:本文提出了一种名为MERML的数据驱动递归动力学模型,首次将递归算法与机器学习结合用于化学反应动力学建模,显著提升了模型的准确性、适用范围和鲁棒性。该方法通过递归关系建立反应物浓度的时间序列映射,并采用多重估计策略增强性能。实验基于包含18种反应类型的模拟数据集以及Dushman反应等三种实际化学反应进行验证,结果表明MERML在预测精度(R²=0.988)、抗噪能力和小样本学习方面均优于传统模型和基线方法。研究表明,MERML为复杂化学反应的动力学分析提供了高效且通用的新工具。

6. Temporal Distribution Shift in Real-World Pharmaceutical Data: Implications for Uncertainty Quantification in QSAR Models

期刊:arXiv

链接:https://arxiv.org/abs/2502.03982

简介:本文探讨了真实世界药物数据中时间分布偏移对QSAR模型不确定性量化的影响,创新点在于系统评估了多种不确定性估计方法在时间分布偏移下的表现。研究基于15个生物测定数据集,采用时间分割策略分析标签和描述符空间的分布变化,并比较了随机森林、多层感知器及贝叶斯神经网络等方法的性能。实验结果表明,MLPE和BNN在大多数测定中表现优异,但显著的时间分布偏移会削弱不确定性估计方法的性能。研究表明,在实际应用中需谨慎选择不确定性量化方法以应对数据分布的变化。

7. CL-GNN: Contrastive Learning and Graph Neural Network for Protein–Ligand Binding Affinity Prediction

期刊:Journal of Chemical Information and Modeling

链接:https://pubs.acs.org/doi/10.1021/acs.jcim.4c01290

简介:本文提出了一种结合对比学习和图神经网络的自我监督学习框架(CL-GNN),用于预测蛋白质-配体结合亲和力,创新点在于通过对比学习和分子图增强技术,有效捕捉蛋白质-配体相互作用,提升了预测精度和模型的可解释性。方法上,CL-GNN通过对比学习预训练,使用三种分子图增强策略(原子掩码、键删除、子图移除)生成正负样本,并通过图神经网络编码器提取特征,最后通过多层感知机进行下游任务微调。实验使用了BioLiP数据库中的371458个未标记蛋白质-配体复合物进行预训练,并在PDBbind v2016和v2013数据集上进行微调和测试,结果显示CL-GNN在PDBbind v2016核心集上的RMSE为1.200,Pearson相关系数为0.838,表现优于现有模型。总结而言,CL-GNN通过自我监督学习和大规模未标记数据预训练,显著提升了蛋白质-配体结合亲和力预测的性能和泛化能力。

8. Barlow Twins deep neural network for advanced 1D drug–target interaction prediction

期刊:Journal of Cheminformatics

链接:https://jcheminf.biomedcentral.com/articles/10.1186/s13321-025-00952-2

简介:本文提出了一种结合Barlow Twins自监督学习架构和梯度提升机(GBM)的混合方法BarlowDTI,用于高效预测一维药物-靶标相互作用(DTI),显著提升了小数据集下的预测性能。该方法利用扩展连接性指纹(ECFP)和双语蛋白质语言模型(PLM)生成特征,并通过GBM进行训练。实验在BioSNAP、BindingDB、DAVIS等多个基准数据集上完成,结果表明BarlowDTI在十四个评估数据集中十个表现最佳,并通过案例研究验证了其在真实场景中的适用性。这项研究为药物发现提供了高效且可解释的工具,推动了分子相互作用的理解与应用。

9. MOL-Mamba: Enhancing Molecular Representation with Structural & Electronic Insights

期刊:arXiv

链接:https://www.arxiv.org/abs/2412.16483

简介:论文提出了一种名为MOL-Mamba的框架,通过结合分子结构与电子信息提升分子表示学习的性能,其创新点在于引入了Mamba增强图学习和多层次特征融合机制。方法包括基于Atom & Fragment Mamba-Graph的分层结构推理模块和结合分子结构与电子相关性的Mamba-Transformer融合模块,并采用结构分布协同训练和E-语义融合训练策略。实验在GEOM预训练数据集和11个MoleculeNet基准数据集(如BBBP、Tox21、ESOL等)上进行,结果表明MOL-Mamba在8个数据集上超越现有方法,例如在BBBP数据集上达到75.0%的ROC-AUC,在ESOL数据集上实现0.63的最低MAE。研究为药物发现和材料科学提供了高效的分子性质预测工具。

10. Grappa – a machine learned molecular mechanics force field

期刊:Chem. Sci.

链接:https://pubs.rsc.org/en/content/articlelanding/2025/sc/d4sc05465b

简介:本文提出了一种名为Grappa的机器学习框架,用于预测分子力学力场参数,通过图注意力神经网络和具有对称性保持位置编码的Transformer直接从分子图中学习参数,显著提升了力场的准确性,同时保持了与传统分子力学力场相同的计算效率。Grappa在Espaloma数据集上进行了训练和评估,该数据集包含超过14,000个分子和100多万个构象,涵盖了小分子、肽和RNA,实验结果表明Grappa在能量和力的预测上优于传统力场和Espaloma力场,特别是在肽的二面角势能面和J耦合值的实验测量上表现出色。Grappa的高数据效率和简单输入特征使其能够轻松扩展到化学空间的新领域,如肽自由基,并在大分子模拟中展示了良好的可迁移性,从小蛋白质到整个病毒颗粒的分子动力学模拟中均表现出色。Grappa为生物分子模拟提供了接近化学精度的力场,同时保持了与传统蛋白质力场相同的计算成本。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档