前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >J. Chem. Inf. Model. | AI驱动的一站式创新药物发现平台DrugFlow2.0

J. Chem. Inf. Model. | AI驱动的一站式创新药物发现平台DrugFlow2.0

作者头像
DrugAI
发布2024-07-05 13:03:41
1410
发布2024-07-05 13:03:41
举报
文章被收录于专栏:DrugAI

DRUGAI

本文介绍一篇浙江大学侯廷军教授团队和碳硅智慧联合发表在计算化学领域权威期刊Journal of Chemical Information and Modeling上发表论文《DrugFlow: An AI-Driven One-Stop Platform for Innovative Drug Discovery》,报导了具有自主知识产权的AI驱动的一站式创新药物发现平台DrugFlow的最新研发进展。DrugFlow2.0涵盖苗头和先导分子发现及优化等药物研发关键环节,集成世界领先的原创分子对接、QSAR建模、成药性预测、分子生成、虚拟筛选算法,并提供用户友好的操作界面,旨在帮助药化专家更高效便捷地发现和设计具有开发潜力的成药分子。

DrugFlow2.0核心功能概述

DrugFlow2.0共包含12个模块(图1),覆盖分子对接、成药性预测、分子生成、QSAR建模四项核心任务以及虚拟筛选和分子工厂两个为特定应用场景定制的综合性模块。

图1. DrugFlow功能概览

分子对接:平台提供了Inno-Docking和Inno-Rescoring两个模块,分别对应分子对接和基于已有对接构象进行重打分两个子任务。Inno-Docking模块在集成物理对接程序AutoDock Vina的基础上,又集成了领域领先的自研AI对接方法CarsiDock。CarsiDock可以称的上是AI和物理的有机结合,它依赖于深度学习模型来预测配体与蛋白之间的距离矩阵,并通过GPU加速的物理引导的快速搜索算法来将距离矩阵重构为结合构象。该方法在多个数据集上展现出出色的对接和筛选性能,并能高效地生成拓扑结构合理的结合构象。AutoDock Vina作为最广为使用的开源对接程序之一,其内置版本已进行进一步优化以提升计算效率,并可结合领域领先的打分方法RTMScore对其输出进行重打分,以提升其对接和筛选性能。此外,平台还提供了完整的蛋白预处理、配体预处理、自动智能化设置对接参数能力。

成药性预测:平台提供了Inno-ADMET、ChemFH和Inno-SA三个模块,可对分子的成药性进行全面评估。其中Inno-ADMET模块共支持76种物化性质、5种药化性质、21种成药性参数、27种毒性性质的系统性评价。目前该模块提供两种自主知识产权算法,分别为基于多任务图神经网络的MGA方法以及基于多模态预训练语言模型的MERT方法,其中前者可结合自研的基于子结构掩盖的图神经网络可解释性方法SME识别关键子结构,为用户提供更为直观的模型解释,而后者则表现出更优的预测准确率,有望实现更为准确的性质预测。

QSAR建模:平台提供了Inno-QSAR模块用于模型训练,并提供了Inno-QSAR Application模块来应用已训练模型进行预测。在Inno-QSAR模块中,用户不仅可采用两个源于MGA和MERT的预训练模型对特定预测任务进行微调,也可结合传统分子描述符和AutoML自动化建模流程自动构建QSAR模型。在结果展示页面,该模块还提供完整的模型评价指标,并对模型表现做出相应解释。

分子生成:尽管平台并未提供具体的分子生成模块,但在使用分子工厂流程时可调用多种底层的自研分子生成算法,以支持从头分子生成以及包括R基团优化、侧链修饰、Linker设计、骨架跃迁在内的多种分子优化任务。平台核心算法包括CarsiLinker、CarsiLinker3D、ResGen、Delete、Smiles-GPT和FragGPT。CarsiLinker是一个专门为Linker设计任务而构建的E(3)等变图变分自编码器,对于两个给定的三维片段,其可通过预测锚定原子来生成Linker图以及它们的三维坐标。CarsiLinker3D则进一步将蛋白口袋信息引入到模型训练中,依靠三维条件扩散模型将不同数目的片段进行拼接,进而适用于四个不同的分子优化任务。ResGen通过两种自回归策略来分别学习配体与蛋白之间的相互作用以及每个原子的几何分布,进而可实现在蛋白口袋内的从头分子生成。Delete则在ResGen的基础上进一步引入了基于表面的蛋白表征策略以及统一的掩码策略,以适用于不同的分子优化任务。Smiles-GPT和FragGPT属于基于SMILES的语言模型,其中前者为R基团优化任务而设计,而由于将分子片段作为基本单元,后者则适用于所有的五个分子生成场景。

虚拟筛选:虚拟筛选模块为用户提供了可供定制的虚拟筛选流程,以实现对Enamine、ChemDiv、ChemBridge等商业化合物库的层级式虚拟筛选。对于一个已知结合位点的靶标,平台将首先调用Inno-ADMET模块来筛去那些类药性较差的分子,然后采用计算效率较高的KarmaDock进行对接筛选,最后则采用对接精度更优的CarsiDock进行进一步筛选,以挑选潜在的富集分子。KarmaDock是另一个已集成在平台中的自研AI对接方法,其对给定数据集上的单个分子的对接平均仅耗时18毫秒,而CarsiDock尽管富集能力更优,但在相同数据集上需耗费大约1.726秒,而将二者结合有望实现计算精度与速度的平衡。

分子工厂:分子工厂模块则在虚拟筛选模块的基础上进一步引入了分子生成的功能,以实现全流程的分子设计。鉴于分子生成算法的多样性,该模块既可用于苗头分子的发现,也可用于苗头/先导分子的优化。整体而言,在通过AI分子生成模型针对给定靶点和性质约束条件获得大量的分子后,平台将提供完善且高效的自动化筛选流程,以基于分子的物理化学性质和成药性、分子与靶点的关键相互作用以及结合药化专家的经验筛选出潜在有效的分子,进而提高研发效率。

与现有AI驱动的药物发现平台的比较

作者还进一步将DrugFlow和三个具有相似功能且经同行评审的平台(MolProphet、AIDDISON和Chemistry42)进行了比较。如表1所示,这四个平台都基于SaaS模式而开发,且均拥有较为干净且用户友好的操作界面。但考虑到运营成本,这四个平台均需要注册方可使用。它们的主要区别在于它们的底层算法。其中Chemistry42专门为分子设计和优化任务而设计,因此其所有底层模块均是为分子生成流程所服务的。AIDDISON是一个可支持分子生成、成药性预测、相似性搜索、分子对接以及甚至逆合成路径分析的综合性药物设计平台,但其集成的大部分工具并非是AI驱动的,且有极大一部分工具直接来自于其他CADD软件包。MolProphet也是一个为加速早期药物发现流程而设计的综合性药物发现平台,但该平台上的几乎所有的AI驱动的药物设计工具均来自于第三方,这也表明他们在算法开发上的弱势。DrugFlow同样致力于覆盖早期药物发现的全流程,而其优势主要体现在算法层面的创新性。多种高精度、高效率且极具创新性的核心算法的引入,再加上功能的多样性以及界面的易操作性,保证了该平台的核心竞争力。

表1. DrugFlow与其他已经同行评审的AI药物发现平台主要特色的比较

结论

DrugFlow是一个AI驱动的一站式药物设计平台,为用户提供了一个方便、安全、基于云的SaaS引擎,用于加速早期药物发现过程。它不仅为非专业的计算化学研究人员提供了一个干净、灵活、友好的界面来进行分子对接、QSAR建模、分子生成等复杂的计算操作,也为计算化学专家提供了一系列领域领先的原创CADD方案。可靠的核心算法、友好的用户界面和有序的管理系统无缝结合,形成了DrugFlow独一无二的特色。总而言之,在如今这个AIDD越来越盛行的年代,DrugFlow已展现出巨大的应用潜力,有望在未来的药物发现中发挥越来越重要的作用。

DrugFlow访问地址:https://drugflow.com/

参考资料

Shen C, Song J, Hsieh CY, Cao D, Kang Y, Ye W, Wu Z, Wang J, Zhang O, Zhang X, Zeng H, Cai H, Chen Y, Chen L, Luo H, Zhao X, Jian T, Chen T, Jiang D, Wang M, Ye Q, Wu J, Du H, Shi H, Deng Y, Hou T. DrugFlow: An AI-Driven One-Stop Platform for Innovative Drug Discovery. J Chem Inf Model, 2024, https://doi.org/10.1021/acs.jcim.4c00621.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档