Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >JCIM | 可解释人工智能助力临床前相关性评估

JCIM | 可解释人工智能助力临床前相关性评估

作者头像
DrugAI
发布于 2021-07-05 02:22:25
发布于 2021-07-05 02:22:25
5340
举报
文章被收录于专栏:DrugAIDrugAI

作者:杨慧丹 审稿:周珍冉

今天给大家介绍来自苏黎世联邦理工学院的José Jiménez-Luna、Gisbert Schneider,以及勃林格殷格翰药业有限公司的Miha Skalic、Nils Weskamp四人联合发表在JCIM期刊上的一项研究成果《Coloring Molecules with Explainable Artificial Intelligence for Preclinical Relevance Assessment》。该研究通过将积分梯度可解释人工智能(XAI)方法应用于图神经网络模型,提高了理性分子设计的建模透明度,并基于四个药理学相关ADME终点的实验,验证了所提出的方法能够突出与已知药效团基序一致的分子特征和结构元素,正确识别性质断崖,并提供了对非特异性配体-靶标相互作用的见解。

研究背景

成功的候选药物不仅要对特定的靶蛋白或通道具有足够的活性,还要具有合适的吸收、分布、代谢和排泄(ADME)特性和安全性。定量构效关系(QSPR)方法已被广泛用于缩小计算机模拟实验与体外数据之间的差距,而深度学习方法正是最流行的机器学习QSPR方法之一。其中,消息传递神经网络(MPNN,通常被称为图神经网络)在基于配体的分子性质预测方面表现出了良好的性能,但对已建立的化学语言缺乏可解释性,其在药物发现中的实用性和可接受性受到了限制,且其存在的Clever Hans effect(聪明汉斯效应)和做出错误预测的事实也进一步加剧了这种局限性。“可解释的”人工智能(XAI)则旨在通过使机器学习方法的决策过程对于人类思维更加透明,从而克服其中的一些限制。

研究团队在此背景下开发了一个基于结构和特性的XAL方法,即积分梯度特征归因技术,用于检验其对ADME和安全相关终点的实用性。作者提供了这种XAI方法的第一个开源实现,所有经过训练的模型和评估代码可以供其他研究人员重现显示的结果、对新示例进行测试,并将该方法应用于他们自己的消息传递模型。

模型与方法

XAL方法

该方法将消息传递图神经网络(GNN)与前馈神经网络(FNN)相结合,处理以分子图形式呈现的输入,分子图具有原子、键和计算的全局属性(例如:正辛醇-水分配系数、拓扑极性表面积),然后应用积分梯度法来计算原子、键和全局重要性得分。

图1.XAL方法和神经网络架构的示意图

消息传递神经网络(MPNN)属于图卷积神经网络(GCN)家族,本研究应用了 Gilmer等人提出的MPNN架构,该架构结合了图卷积网络和Set2Set子模型来嵌入分子并计算预测。此外,为了解释非特异性分子相互作用,还包括一个全连通的神经网络子架构以计算物理化学特征。图1介绍了关于如何使用不同类型的信息来生成预测的可视化表示,包括通过消息传递生成的潜在图向量和计算出的全局分子特性的向量。

数据处理

实验选取了四个药理学相关参数,分别为血浆蛋白结合(PPB)、被动药物渗透性(Caco-2 测定)、人类ether-a-go-go相关基因 (hERG) 钾通道抑制和细胞色素 P450 抑制(CYP3A4 亚型)。为了确保潜在用户能够探索所提出的XAI方法的适用性并利用训练好的模型,研究团队进行了一项文献调查以收集关于这四个终点的公开数据。

表1.药理学终点的数据集

表2.使用 RDKit 计算的顶点、键和全局分子图特征

把不同来源的分子转换为 InChI 字符串并使用 RDKit 进行消毒。如果同一化合物在某一终点有多个测量值,则取其算术平均值。同时还提供了数据源之间化合物的重叠百分比,以及不同测量值之间的平均值和中值标准偏差,其结果显示,所报告的测量值之间的总体一致性似乎也很高。

实验结果

模型性能评估

使用k = 10交叉验证方案来评估模型性能,其定量基准的结果如图2、表3所示。

图2.模型的性能

图2前三个二维密度图分别描述了血浆蛋白结合、被动渗透率和hERG抑制数据集的实验值与预测值,最后一个子图描述了CYP3A4 P450数据集的受试者工作特征(ROC)曲线。

表3分别描述了实验值与预测值之间的Pearson’s R(皮尔逊相关系数)、R2(决定系数)、RMSE(均方根误差),以及AUC(ROC曲线下面积)。

表3.相关终点的预测性能

所有经过训练的模型都显示出了预测能力,三个回归模型的R值在0.53和0.74之间,二元分类器的AUC = 0.85。这些值表明了训练任务的难度各不相同。尽管没有一个模型表现出完美的预测能力,但获得的结果明显优于随机,说明模型在学习过程中识别了有意义的分子图特征。

模型可解释性评估

之前的研究通过评估原子贡献的可加性或通过将它们与合成生成的结构-活性关系进行比较来量化所提供的分子着色的质量进而验证可解释的机器学习模型。本研究从可用文献中提取并汇编了25个外部分子序列。这些系列代表背景知识,并包含本研究中考虑的药理学终点相关的已知示例,其中大部分是使用的训练集之外的。此外,研究者还用以下几个不同的方法检验了模型:

1.是否能够突出相关的药效团基序——药效基团的识别

分析脂肪酸特征和由五个键单元的疏水部分隔开的两个酸性基团组成的药效团基序这两个相关特征以评估血浆蛋白结合潜力。

对于 hERG 终点,显示了两种情况,其中 XAI 能够重现先前在文献中报告的活性变化,然而这些例子也突出了该方法的潜在局限性,特别是其他突出显示的模式与已建立的 hERG 结构-活性关系不一致。

对于 CYP3A4 终点,相应的模型清楚地识别了先前报告的特定药效团的基序,突出了灵活骨架、氢键供体/受体部分和疏水相互作用的重要性,相应结构特征的相对重要性被正确识别。

2.在所考虑的数据集中成功检测到性质断崖(例如:引起显著性质或活动变化的微小结构变化)——性质断崖的识别

通过匹配分子对分析来评估训练集中是否存在活性悬崖以进一步评估模型识别所选文献示例之外的性质断崖的能力。根据构效景观指数 (SALI) 对cliff进行排名。该功能平衡了一对化合物的结构相似性及其预测的性质差异。所提出的方法正确识别了导致这些显著性质差异的几个结构元素。

3.能够识别由分子特性(例如log P、TPSA)介导的“非特异性”配体-蛋白质相互作用——全局重要性分析

许多ADME和相关毒理学终点,例如被动渗透性或血浆蛋白结合参数,不仅仅以特定的结构基序为特征,因此还需研究全局分子特性(例如log P、TPSA)对目标终点的影响,以实现最佳化合物。血浆蛋白结合与亲脂性、增加循环半衰期和减少肾小球滤过呈正相关。

通过Caco-2测定法测量的Papp还已知与全局分子特性相关,例如TPSA(具有大极性表面积的化合物不太可能渗透细胞膜)和亲脂性(具有更大 logP 的化合物更容易渗透)。XAI 方法再次正确捕获了第一个关系,表明分配给 TPSA全局特征的重要性与Papp端点之间存在适度的负相关(R = -0.59,p < 0.01)。

其他着色方法的比较

将本文提出的 XAI 方法与Sheridan发布的分子着色方法进行了比较。为了突出特定原子的重要性,这种方法迭代地“屏蔽”单个原子并计算分子指纹,然后将这些指纹与机器学习模型相结合,使用和不使用掩蔽原子的模型预测之间的差异作为原子重要性的代理。这项工作中提出的基于梯度的方法对这些呈现的示例失败了,而基于指纹的方法无法重现本研究中呈现的任何其他着色示例,这表明它们的适当性可能是视情况而定。

鉴于化学信息学中原子着色方法缺乏既定的定量基准,两种方法的优越性仍有待确定。特别是,虽然这里提出的积分梯度方法有很好的理论基础,并且满足一些理想的特征属性公理,但它需要一个完全可微的模型。另一方面,Sheridan提出的方法虽然本质上更简单,但与模型无关。此外,作者还观察到两种不同方法强调的子结构之间的一致性有限,提倡并行使用多个模型。

总结

本研究描述了一个流行的XAI框架(积分梯度特征归因技术)在四个药理学相关ADME终点(血浆蛋白结合、hERG通道抑制、被动通透性和细胞色素P450抑制)的应用。结果表明,所提出的方法正确复制了与已知药效团模式相对应的基序,识别了性质断崖,并检测到了由全局分子属性介导的非特异性配体-受体相互作用。

参考资料

José Jiménez-Luna, Miha Skalic, Nils Weskamp, and Gisbert Schneider

Journal of Chemical Information and Modeling 2021 61 (3), 1083-1094

DOI: 10.1021/acs.jcim.0c01344

代码

https://github.com/ETHmodlab/molgrad

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nat. Mach. Intell. | 可解释性人工智能(xAI)遇上药物发现
今天给大家介绍瑞士苏黎世联邦理工学院化学与应用生物科学系 Gisbert Schneider等人在Nature Machine Intelligence上发表的文章“Drug discovery with explainable artificial intelligence”。本文综述总结了可解释人工智能最突出的算法概念,并预测了未来的机会、潜在的应用以及一些剩余的挑战。希望能为可解释人工智能技术的发展和接受做出更多的努力。
DrugAI
2021/02/02
7420
Nat. Mach. Intell. | 可解释性人工智能(xAI)遇上药物发现
徐峻|人工智能与药物设计学:新范式探索 (4)
随着信息技术的不断发展,药物设计方法学的新概念、新方法和新思路持续更新,药物发现范式也与时俱进。人工智能作为新工具,已应用于药物发现过程的多个方面,引起了制药行业的高度关注,也带来了对药物发现科学理论和方法学的新思考和新探索。
智药邦
2022/04/13
5120
徐峻|人工智能与药物设计学:新范式探索 (4)
JCIM | 用于自动生成类药分子的生成网络复合体(GNC)
目前的药物发现工作既昂贵又耗时。如何创造出种类繁多的新型化合物,使其不仅具有理想的药理特性,而且低收入人群也能廉价获得,仍然是一项具有挑战性的任务。这项工作中,研究人员开发了一种生成式网络复合体(GNC),通过自动编码器在潜在空间中的梯度下降,基于多性质优化生成新的类药分子。研究人员的GNC中,多化学性质和相似度分数都被优化,以生成具有所需化学性质的类药分子。为了进一步验证预测的可靠性,这些分子被独立的基于分子指纹的预测器重新评估和筛选,得出几百个新的候选药物。
DrugAI
2021/02/02
1.1K0
JCIM | 用于自动生成类药分子的生成网络复合体(GNC)
J. Chem. Inf. Model. | ADMET-PrInt药物特性分析平台
今天为大家介绍的是来自Sabina Podlewska团队的一篇论文。在新药物的探索过程中,计算策略的发展改变了寻找新药的方式。虽然计算机辅助设计的策略依旧主要集中于确保候选化合物对特定目标的有效性,但是化合物的理化性质及ADMET(吸收、分布、代谢、排泄和毒性)特性的表征已成为计算机辅助药物设计不可或缺的一部分。在这项研究中,作者开发了一款在线应用程序ADMET-PrInt,用于对选定化合物的以下特性进行计算机辅助评估:心脏毒性、溶解度、遗传毒性、膜透过性和血浆蛋白结合能力。除了预测特定属性外,ADMET-PrInt还能够通过解释性方法识别影响这些属性的化合物特征。这对于药物化学家来说至关重要,因为它极大地简化了根据评估属性对化合物结构进行优化的过程。
DrugAI
2024/04/12
2190
J. Chem. Inf. Model. | ADMET-PrInt药物特性分析平台
Drug Discov Today|人工智能用于发现针对新发传染病的新型抗生素
2021年11月5日,来自路易斯安那州立大学的Adam Bess和不列颠哥伦比亚大学的Kishor M.Wasancd等人在Drug Discovery Today合作发表综述“人工智能用于发现针对新发传染病的新型抗生素”。
智药邦
2021/12/20
3900
Drug Discov Today|人工智能用于发现针对新发传染病的新型抗生素
Drug Discov. Today | 从计算机辅助药物发现到计算机驱动的药物发现
计算化学和基于结构的设计历来被认为是可以帮助加速药物发现过程的工具,但通常不被认为是小分子药物发现的驱动力。过去的十年中,该领域取得了巨大的进步,包括(1)开发基于物理学的计算方法,以准确预测从效力到溶解度的各种终点;(2)人工智能和深度学习方法的改进;(3)随着GPU和云计算的出现,计算能力大幅提高,从而有能力探索和准确描述计算中大量的类药化学空间。结构生物学同时也取得了进展,如低温电子显微镜(cryo-EM)和计算蛋白质结构预测,使人们能够获得更多高分辨率的新型药物-受体复合物的三维结构。这些突破的汇合使结构化的计算方法成为发现新型小分子治疗方法的驱动力。2021 年 8 月 30 日发表在《Drug Discovery Today》的综述“From computer-aided drug discovery to computer-driven drug discovery”进行了阐述。
DrugAI
2021/09/17
8270
Drug Discov. Today | 从计算机辅助药物发现到计算机驱动的药物发现
Drug Discov Today|赛诺菲:机器学习引导的早期小分子药物发现
2022年3月29日,赛诺菲的NikhilPillai等人在Drug Discov Today杂志发表文章,分析和反思了机器学习在临床前小分子药物发现中的多种应用,并简要介绍了机器学习任务中的分子表征方法。
智药邦
2022/04/13
7920
Drug Discov Today|赛诺菲:机器学习引导的早期小分子药物发现
Future Med Chem|企业级ADME性质早期预测模型的开发与应用
2021年9月16日,Future Medicinal Chemistry杂志发表文章,介绍了杨森制药的研究人员开发的预测药物ADME性质的gTPP预测模型。
智药邦
2021/12/06
7950
Future Med Chem|企业级ADME性质早期预测模型的开发与应用
JCIM|逆向药物设计:从目标性质到分子结构
2022年6月2日,来自美国国家转化科学促进中心的Hongmao Sun与Yuhong Wang等人在JCIM上发表文章,作者描述了一种新的策略,即逆向药物设计(RDD),从头开始设计新的小分子药物,满足多个预定义的目标。结果表明,RDD具有显著改善当前药物发现过程的潜力。
智药邦
2022/11/16
5920
JCIM|逆向药物设计:从目标性质到分子结构
Drug Discov Today|化学分子指纹的概念和应用
分子指纹(Molecular fingerprints)可以低计算成本的方式表示大规模化学数据集中化合物的化学(结构、物理化学等)性质。它们在将化学数据集中的分子转换为适合于计算方法的一致输入格式(bit向量或数值)方面发挥着重要作用。在这篇综述中,作者将常见和最先进的分子指纹归纳并分类为8种不同类型(基于字典的、圆形的(circular)、拓扑的、药效团的(pharmacophore)、蛋白质-配体相互作用的、基于形状的、强化的和多种的)。作者还强调了分子指纹在早期药物研发中的应用。因此,本综述为药物研发使用合适的化合物(或配体-蛋白质复合物)指纹的选择提供了指南。
智药邦
2023/02/14
2.9K0
Drug Discov Today|化学分子指纹的概念和应用
JMC|用于化合物优化中性质预测的可解释机器学习
大多数最先进的 ML 模型都具有黑匣子特性。在ML 模型的预测性能和解释能力之间通常需要权衡。
智药邦
2022/03/04
1.2K0
JMC|用于化合物优化中性质预测的可解释机器学习
药物发现中的深度学习
2022年10月28日,来自巴基斯坦的研究团队在期刊Journal of Biomolecular Structure and Dynamics上发表综述论文Deep learning in drug discovery: a futuristic modality to materialize the large datasets for cheminformatics。论文全面总结了人工智能方法在药物发现中的应用,并针对Covid-19的药物发现过程进行了详细的分析。
智药邦
2023/02/14
5600
药物发现中的深度学习
CADD、人工智能和机器学习在药物发现中的应用:方法概述
2022年11月5日,印度国家药物教育与研究所的专家在Eur J Pharm Sci杂志发表文章,系统梳理了CADD、人工智能和机器学习在药物发现中的应用方法。
智药邦
2023/02/15
1.3K0
CADD、人工智能和机器学习在药物发现中的应用:方法概述
BMC Bioinform | 拓扑增强的分子图表示用于抗乳腺癌药物的筛选
2022年9月19日,北京邮电大学傅湘玲团队在BMC Bioinformatics上发表文章。作者提出了ABCD-GGNN(Anti-Breast Cancer Drug selection method utilizing Gated Graph Neural Networks),一种使用门控图神经网络(GGNN)架构来筛选抗乳腺癌药物的新型算法。ABCD-GGNN通过每个不同化合物的原子描述符构建原子级图,可以拓扑地学习候选药物的隐式结构和子结构特征,然后将表示与显式离散分子描述符集成,生成分子级表示。因此,ABCD-GGNN的表示可以归纳地预测ERα、药代动力学特性和每种候选药物的安全性。
智药邦
2022/11/16
5340
BMC Bioinform | 拓扑增强的分子图表示用于抗乳腺癌药物的筛选
JCIM|扩散模型在从头药物设计中的应用与发展
近年来,生成模型(Generative Models)在分子科学,特别是药物发现中,发挥着越来越重要的作用。从头药物设计(De Novo Drug Design, DNDD)是药物发现的关键步骤,其主要目的是在不依赖于已有分子骨架的情况下设计出全新分子。这种方法可以极大地拓宽化学空间,发现具有特定药效的全新小分子。在这类任务中,生成模型,尤其是扩散模型(Diffusion Models),被认为是能够生成具有特定3D分子结构的强大工具,特别是在以3D结构为基础的药物设计中,如分子对接(molecular docking)和蛋白质-配体复合物预测。
智药邦
2024/10/08
2590
JCIM|扩散模型在从头药物设计中的应用与发展
Drug Discov Today|人工智能增强的药物设计和开发:迈向计算型精准医学
2021年9月20日,来自法国制药公司施维雅(Servier)的Philippe Moingeon等人在Drug Discovery Today发表文章,对人工智能在药物设计和开发方面的四个主要应用进行了阐述。
智药邦
2021/10/15
2.7K0
Nat Chem Biol|临床前药物发现中的机器学习
2024年7月19日,来自加拿大麦克马斯特大学的研究人员在Nature Chemical Biology上发表研究Machine learning in preclinical drug discovery,讨论了在药物发现的临床前阶段整合机器学习方法的现状和未来前景,重点关注其在不同疾病领域的应用,以加速初始药物发现、作用机制(MOA)阐明和化学性质优化。
智药邦
2024/07/30
2580
Nat Chem Biol|临床前药物发现中的机器学习
使用图生成多任务模型缩小基于靶标和基于细胞的药物发现之间的差异
本文介绍的是由中国科学院深圳先进技术研究所的Fan Hu、Dongqi Wang等人发表在arXiv上的预印文章《Bridging the gap between target-based and cell-based drug discovery with a graph generative multi-task model》。作者提出了一种基于图的多任务深度学习模型(MATIC)来识别同时具有靶标抑制和细胞活性的化合物。在SARS-CoV-2 数据集上,MATIC模型比传统方法在筛选体内有效化合物方面更具优势。作者探索了模型的可解释性,发现靶标抑制(体外)或细胞活性(体内)任务学习的特征与分子性质相关性和原子功能存在差异。基于这些发现,作者利用基于蒙特卡洛算法的强化学习模型生成具有体外和体内功效的新型多属性化合物。
DrugAI
2022/11/28
4300
使用图生成多任务模型缩小基于靶标和基于细胞的药物发现之间的差异
JACS|浙江大学侯廷军等:生成式AI助力药物分子结构优化全面综述
2024年11月5日,浙江大学侯廷军等人在Journal of the American Chemical Society期刊上发表了一篇题为“Deep Lead Optimization: Leveraging Generative AI for Structural Modification”的研究文章。
智药邦
2024/12/19
1.6K0
JACS|浙江大学侯廷军等:生成式AI助力药物分子结构优化全面综述
Nat Rev Drug Discov|深度学习与QSAR的融合
2023年12月8日,来自北卡罗来纳大学教堂山分校的Alexander Tropsha、卡内基梅隆大学的Olexandr Isayev等研究人员在Nature Reviews Drug Discovery发表综述文章Integrating QSAR modelling and deep learning in drug discovery: the emergence of deep QSAR。
智药邦
2024/03/05
4610
Nat Rev Drug Discov|深度学习与QSAR的融合
推荐阅读
相关推荐
Nat. Mach. Intell. | 可解释性人工智能(xAI)遇上药物发现
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档