
期刊: arxiv 链接: https://arxiv.org/abs/2504.05844v1
简介: 本文提出ASE-Mol框架用于分子性质预测,通过动态识别正负子结构提升模型性能和可解释性。该框架利用BRICS分解和子结构感知,结合专家混合(MoE)方法,将分子子结构分类并分配给专门的专家网络处理。实验使用MoleculeNet的八个基准数据集,与多种基线模型对比,并进行消融实验等。结果显示,ASE-Mol在准确性和可解释性上表现优异,能有效区分和适应不同子结构。
期刊: arxiv 链接: https://arxiv.org/abs/2504.07379v1
简介: 文章提出tanh-cPIKAN架构,系统研究优化器、模型表示和训练配置对PINNs和PIKANs性能的影响,为灰色盒发现提供指导。研究采用两种系统药理学模型,对比多种优化器及学习率调度器,分析不同精度设置下模型性能。实验用的数据集来自药代动力学和药效学模型。结果表明,混合策略效果最佳,tanh-cPIKANs在双精度下优势明显。该研究为改进物理信息网络训练提供了有价值的见解。
期刊: arxiv 链接: https://arxiv.org/abs/2504.07297v1
简介: 本文利用数据融合技术提升分子性质预测模型性能,解决多任务学习在稀疏数据集上的不足。通过融合单任务模型的分子嵌入训练多任务模型,并在两个数据集上进行实验。其中一个是新编译的包含多种实验和计算性质的稀疏数据集,另一个是QM9基准数据集。实验结果显示,融合的多任务模型在稀疏数据集上优于标准多任务模型,在完整数据集上也有良好表现。
期刊: arxiv 链接: https://arxiv.org/abs/2504.07156v1
简介: 本文提出PLM-eXplain(PLM-X)可解释适配器层,平衡蛋白质语言模型的可解释性与预测能力。方法是将ESM2的嵌入分解为可解释子空间和保留预测能力的残差子空间。在蛋白质聚集倾向、细胞外囊泡关联和跨膜螺旋预测三个任务上进行实验,使用来自AlphaFoldDB等的数据集。结果表明,PLM-X能保持原模型性能,且可解释模型决策。
期刊: Applied Sciences 链接: https://doi.org/10.3390/app15063283 代码: https://github.com/yelou2022/LPBERT
简介: 本文提出LPBERT深度学习框架用于蛋白质-蛋白质相互作用预测,创新地引入ProteinBERT获取蛋白质序列嵌入表示,并设计特定模块提升性能。该框架以ProteinBERT为编码器,结合卷积神经网络、Transformer编码器和双向长短期记忆网络对蛋白质序列进行处理和预测。实验使用多个公开的高置信度基准数据集,与多种方法对比。结果显示,LPBERT在多个数据集上表现优异,在BioGRID的H. sapiens和S. cerevisiae数据集上准确率分别达98.93%和97.94%。
期刊: Journal of Cheminformatics 链接: https://doi.org/10.1186/s13321-025-00992-8
简介: 文章构建了HepatoToxicity Portal(HTP),整合肝毒性知识库与图神经网络预测模型,助力药物研发。其通过整合九个数据库构建HTP-KB,并利用MedDRA术语注释和独特评分系统处理数据;基于预训练的图神经网络MolCLR开发HTP-Pred进行毒性预测。实验使用多个数据库数据训练和评估模型,并与多种现有方法对比。结果表明,HTP-Pred的AUROC达0.761,优于其他方法。HTP为研究人员提供了全面的肝毒性数据和精准的预测服务,推动药物研发进展。
期刊: Research Square 链接: https://doi.org/10.21203/rs.3.rs-6356959/v1 代码: https://github.com/NTU-MedAI/DCT
简介: 本文开发了LM-PROTAC管道,通过嵌入基于Transformer的生成模型并施加结构和属性双重约束,用于生成PROTAC分子。该管道先利用语言模型驱动的亲和力模型筛选分子片段,再在生成过程中对片段进行结构和理化性质约束,最后用多维属性预测模型筛选。实验使用ZINC、BindingDB等多个数据集,以Wnt3a为靶点生成并验证PROTAC分子。结果显示,生成的分子与原始数据集相似,能有效降解目标蛋白。该研究为PROTAC药物生成提供了完整解决方案,提高了药物发现效率。
期刊: Journal of Chemical Information and Modeling 链接: https://doi.org/10.1021/acs.jcim.5c00037 代码: https://github.com/LorenzoAngiolini/Bioconj_calculator
简介: 本文开发了基于机器学习的算法预测抗体偶联药物(ADC)合成中的药物-抗体比(DAR),通过XGBoost算法整合多种数据,提升预测准确性。研究收集并预处理实验数据,将其转化为分子描述符,用多种回归模型对比预测DAR值,选择XGBoost算法并优化其超参数。实验使用自建数据集,涵盖不同单克隆抗体和连接子-有效载荷系统。结果显示,XGBoost模型在赖氨酸和半胱氨酸数据集上(R^{2}) 分数分别达0.85和0.95,预测性能良好。该研究为ADC合成的生物共轭过程优化提供了有效方法。
期刊: IEEE Transactions on Computational Biology and Bioinformatics 链接: https://doi.org/10.1109/TCBBIO.2025.3553815
简介: 文章提出结合分子连接性指数和数据增强技术的方法,用于分子性质预测,能生成可靠数据并提高预测精度。该方法通过保持1阶或价连接性指数不变来修改分子图,生成增强数据,并利用化学规则和标签过滤数据。研究使用五个基准数据集,以多种图神经网络模型为基础进行实验。结果表明,该方法在不同数据分割设置下均表现出色,如在GIN模型上,相比原始模型平均相对准确率提升14.98% 。
期刊: biorxiv 链接: https://doi.org/10.1101/2025.04.08.647768 代码: https://github.com/sergiyayf/PhysiLearning
简介: 本文提出GRAPEVINE框架,通过强化失败概念挖掘肿瘤治疗中隐藏的空间动力学,优化自适应治疗策略。该框架对比高低保真环境中多个强化学习智能体的表现,识别关键特征并优化训练环境。研究构建基于PhysiCell的肿瘤模拟环境,训练智能体并分析其决策行为。结果发现位置依赖生长和细胞运动是治疗失败的关键因素,融入这些特征后智能体性能显著提升。
期刊: Journal of Cheminformatics 链接: https://doi.org/10.1186/s13321-025-00985-7
简介: 文章综述深度学习在虚拟筛选(VS)和分子动力学(MD)模拟中的应用,为相关研究人员提供指导。文中介绍多种深度学习模型,如在VS中用于生成分子指纹、预测结合亲和力等,在MD中用于引导构象采样、计算原子间力等。实验涉及多个数据集和模型,如使用PDBbind数据库训练模型预测药物-靶点相互作用。结果显示,深度学习可提高VS和MD的效率和准确性。