前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Bioinformatics丨SumGNN:基于高效知识图总结的多类型药物相互作用预测

Bioinformatics丨SumGNN:基于高效知识图总结的多类型药物相互作用预测

作者头像
智能生信
发布2021-07-22 11:49:57
7570
发布2021-07-22 11:49:57
举报
文章被收录于专栏:智能生信

作者 | 蔡建华 编辑 | 李仲深

今天为大家介绍的是剑桥大学CaoXiao等人发表在Bioinformatics上的文章“SumGNN: 基于高效知识图总结的多类型药物相互作用预测”。由于药物-药物相互作用(DDI)数据集和大型生物医学知识图(KGs)的不断增加,使用机器学习模型准确检测不良的DDI成为可能。然而,如何有效地利用生物医学大噪声KGs进行DDI检测仍是一个有待解决的问题。此外,以往的研究多集中于二值DDI预测,而多型DDI的药理作用预测更有意义,但任务更艰巨。为了填补空白,作者提出了一种新的方法SumGNN: 知识摘要图神经网络。这个网络是通过子图提取模块实现的,该子图提取模块可以有效地锚定KG中的相关子图,从而在子图中生成推理路径,以及多通道知识和数据集成模块,该模块利用大量外部生物医学知识,显著改善了多类型DDI的预测。SumGNN比最佳模型的性能高出5.54%,在低数据关系类型中性能提高尤其显著。此外,SumGNN通过为每个预测生成的推理路径提供可解释的预测。

一、研究背景

药物-药物不良相互作用(DDI)是指一种药物与另一种药物一起使用时对其效果的改变,这对病情复杂的患者来说是一种常见且危险的情况。未检测到的不良DDI已成为严重的健康威胁,每年仅在美国就造成近7.4万起急诊室就诊和19.5万起住院治疗。为了降低这些风险和成本,准确预测DDI成为临床的一项重要任务。目前有两种类型的数据用于开发DDI检测模型:手动管理的DDI网络和大型生物医学知识图(KGs)。

图神经网络(GNN)通过将DDI预测作为DDI图上的链接预测问题而取得了良好的性能。然而,由于DDI是由复杂的生物医学机制驱动的,现有的深度学习模型往往只基于现有的DDI数据集进行训练,而忽略了对DDI预测有益的大型生物医学KG。最近的一些研究试图通过标准KG和GNN方法的直接集成,将KG集成到DDI预测中。但是由于输入的KG很大且有噪声,而药物对的相关信息是局部的,这给DDI预测建模带来了困难。此外,尽管预测特定的DDI类型是一项更有意义的任务,但大多数现有的工作也只是进行二分类——预测DDI的存在。

在这项工作中,作者提出了一种新的方法SumGNN,它可以有效地利用KG来帮助进行药物间的相互作用预测。SumGNN具有更好的预测性能、效率、诱导性和可解释性。SumGNN使用KG中在药物对周围的局部子图来提取有用的信息,而不是直接利用整个KG。子图公式允许通过锚定相关信息来降低噪声,并且具有高度可伸缩性,因为消息传递的接受域显著减少。然后,作者提出了一个总结方案来生成药物相互作用的机制途径。作者开发了一种层独立的自注意力机制,为子图中的每条边生成信号强度评分,并删除一个分数较高的KG子图路径。由于这个修剪的子图是稀疏的,它提供了关于驱动药物相互作用的生物过程的见解。最后,作者提出使用多通道神经编码来聚合不同的数据源集,从总结子图嵌入到化学结构。它可以利用大量外部生物医学知识来显著地改进多类型DDI预测。此外,神经编码在每次传播中采用不同的子图,形成归纳偏差,促进了低资源DDI类型的泛化。

二、模型与方法

如图1所示,SumGNN由子图锚定、知识摘要和多通道神经编码三个模块组成。对于给定的药物对,作者将其锚定在一个潜在生物医学实体的子图上,它与KG中的药物对很接近。在此基础上,提出了一种新的具有摘要机制的图神经网络,为药物相互作用机理的推理提供了一个浓缩的途径。根据这个通路图,我们使用多通道神经编码,来整合不同来源的可用信息,以产生足够的药物对表示。最后,利用解码分类器对交互结果进行预测。

图1. SumGNN示意图

2.1 局部子图提取模块

生物医学知识图谱描述了人类生物学的复杂机制。KG中多个节点(药物对)的调节可扰乱连接的节点(如疾病、细胞成分等),从而产生涟漪效应,最终导致各种各样的生理结果。当药物对和生物医学实体之间的距离增加时,效果会扩散。因此,为了理解药物相互作用,应该关注KG中药物对周围的局部子图。具体来说,对于药物对u和v,我们首先提取u和v的k-hop相邻节点,d为KG图上两个节点之间的距离。然后,我们根据这些节点的交点得到一个封闭的子图。

由于子图中节点相对位置对中心节点u和v的重要性,作者通过连接一个位置向量来增加子图中嵌入的初始节点。对于子图中的每个节点i,首先计算i与中心药物对节点u, v之间的最短路径长度d(i, u)和d(i, v),然后将其转换为一个位置向量,以此来表示节点i。

2.2 知识摘要模块

除了提供预测结果之外,作者还设计了一个知识摘要模块,将子图信息总结为基于图的潜在药物相互作用路径。需要注意的是,由于药物相互作用通常是由于多种生物医学实体之间复杂的相互作用,因此该路径不是线性的,而是一个稀疏的子图。总结要求需要保留包含对药物相互作用最有用的信号的边,同时去除不重要的路径。为此,模型采用了一个层无关、关系感知的自注意力模块来为子图中的每条边分配权重。这些权值是根据输入特征生成的,表示用于边缘修剪的相互作用信号强度。

注意,现有的图表注意力方法为每一层的每条边生成注意力权值。然而,这种方法可能会为同一边缘提供跨层的潜在矛盾信号,从而排除可解释路径的生成。而SumGNN则采用了一种层独立的注意机制,只依赖于第一层的嵌入来修剪边缘。它为模型的可解释性提供了明确的途径。由于许多生物网络是通过文本挖掘构建的,其中许多边缘可能是假阳性的,这种剪枝机制也允许降噪。

2.3 多通道集成模块

为了获得药物相互作用预测的强大表示,作者整合了一组不同的信息源。

通道一:摘要知识。使用上面描述的知识摘要方法,确定了一个对输入药物对很重要的总结子图。模型想要利用这个子图对输入的药物对生成潜在的表示。

通道二:子图特征。为了得到子图的嵌入,模型取线性层投影到子图层中所有节点的平均值。

通道三:药物指纹特征。化学指纹等分子信息已被证明是药物相互作用的有力预测器。因此,除了网络表示,我们获得摩根指纹

,这是一个药物的预测描述符。在KG中使用这个特征作为输入节点的特征是不可行的,因为KG中除了药物之外还包含了各种类型的节点(比如副作用、疾病和基因),它们不能用摩根指纹来表示,这将导致GNN传递的节点特征不一致。

层级通道聚合。为了组装通过每一层生成的各种表示,模型采用了层聚合机制。模型连接了每一层中节点、子图的嵌入表示,并通过化学表示的连接来更新层聚合的嵌入。最后,将不同的通道组合聚合在一起得到了输入药物对的表示。为了预测这种关系,模型得到一个预测概率向量p,向量中的每个值对应于一种关系的可能性。

三、实验结果

3.1 SumGNN和其他模型的预测性能比较

表1中记录了SumGNN和所有基线模型的性能测试结果。从结果中可以发现,在两个数据集上,SumGNN在DDI预测中表现最好,能够一致准确地预测正确的DDI药理作用。特别是,在DrugBank数据集上,SumGNN在这三个指标上的绝对增幅分别为27.19%、5.47%、4.65%,在TWOSIDES数据集上的绝对增幅分别为2.84%、2.45%、4.50%。这些结果清楚地验证了该模型方法的有效性。

表1. SumGNN和其他模型的实验结果比较

3.2 SumGNN擅长于低数据不平衡关系预测

实验结果表明SumGNN在DrugBank上的改进比TWOSIDES数据集更显著。如果仔细研究这个问题,就会发现的主要区别在于这两个数据集的数据分布,DrugBank更不平衡,它有超过30%的关系类型在训练集中出现了不到50次,有超过10%的关系类型出现了超过1000次。

为了检验模型对与每个关系相关的训练数据大小的预测性能,我们首先将关系类型分成5组,使用不同数量的训练数据,然后在图2中绘制这些组合的平均F1得分。通过比较最强的精度基线(KGNN)和无KG基线(Decagon)的性能,我们发现在样本极为稀少的情况下,SumGNN可以有效地提高性能。当关系的训练样本小于10时,decagon和KGNN都不能给出正确的预测,而SumGNN仍然可以获得57.14%的F1得分。一个潜在的原因是,在每个GNN传播中,SumGNN提供不同的子图,这对不可见的子图形成了迫切需要的归纳偏差,比如低数据关系中的子图。这与KGNN等以前的方法形成了鲜明的对比。证明了SumGNN基于子图的知识摘要对外部知识的有效利用。此外,我们还发现SumGNN对发生次数小于50次的关系的F1评分也有至少38.19%的提高。这是一个重要的发现,因为高的总体准确性并不意味着在所有关系上都表现良好。低数据关系是最难正确预测的,我们证明了SumGNN可以用于这些低数据关系,而以前的其他模型不能。

图2. 不同数量训练样本的F1得分结果

3.3 外部知识对于预测结果的作用

作者发现前7种方法与SumGNN方法相比不能得到令人满意的结果。MLP、Deepwalk、LINE和Node2vec仅使用较浅的嵌入层来学习药物的特征,而没有使用图神经网络来建模药物相互作用,其表达能力有限。此外,GAT虽然考虑了对不同边缘的注意,但没有考虑多关系信息,其性能也不是很好。通过后四种方法与前五种方法的比较,发现KG的使用显著提高了DDI性能,突出了外部知识使用与图神经网络相结合的必要性,因为它可以为DDI任务提供互补的信息。

3.3 知识摘要模块是获取外部知识的最佳模块

比较SumGNN、KGNN和KG-DDI,可以看出SumGNN的表现更为优秀。这表明简单地采用KG嵌入以及社区抽样不足以充分利用DDI的KG信息预测。SumGNN提供了利用外部KG的最佳方法,即子图的使用减少了噪声和无关信息。尽管GraIL也为下游任务提取子图,但它没有使用任何知识摘要技术,这可能会进一步消除局部子图中的无关信息。此外,GraIL在信息传播过程中只考虑位置信息而忽略了多通道特性。

3.3 消融实验

为了研究KG的使用,作者去掉了知识图(SumGNN-KG),并在DDI图上进行预测。从表1中可以看到SumGNN在DrugBank上的Macro F1绝对增加了8.5%,突出了KG的有效性。为了评估知识摘要模块,作者删除了摘要组件(SumGNN-Sum),并使用原始的局部子图来预测结果。可以看到,在Macro F1上,SumGNN为DrugBank增加了3.65%,TWOSIDES增加了2.24%,说明知识摘要模块进一步浓缩了相关信息,提高了绩效。

为了研究多通道神经编码的效果,作者将SumGNN的结果与去除特定通道信息(即子图特征和化学特征)的几种变体进行了比较,发现这些通道信息都对整体性能有贡献。在去除化学指纹(SumGNN-CF)时,DrugBank Macro F1的性能下降了3.28%,印证了各通道不可或缺的作用。同时还发现,用之前的依赖层的注意力替换独立层的注意力(SumGNN-LIA),性能会下降。这表明,模型的注意力机制不仅提供了可解释性,而且提高了预测表现。

四、总结

在本文中,作者提出了一种新的方法SumGNN:多类型DDI预测的知识摘要图神经网络。这个网络主要由一个局部子图模块实现,该模块可以有效地锚定KG的相关子图,这是一种基于自注意的子图摘要方案,可以在子图中生成推理路径,以及多通道知识和数据集成模块,该模块利用大量外部生物医学知识,显著改善了多类型DDI预测。在真实数据集上的实验证明了SumGNN的强大性能。此外,计算方法很大程度上依赖于训练数据。如果与一种特定药物相互作用类型相关的训练数据较少,则很难准确预测。与其他模型相比,SumGNN能够在低资源设置下产生良好的性能。SumGNN也是一个通用框架,可用于预测任何其他相互作用,如药物-疾病相互作用。低资源学习的能力也意味着在寻找罕见疾病药物方面表现出色。


代码

https://github.com/yueyu1030/SumGNN/

参考文献

https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btab207/6189090?searchresult=1

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据集成
数据集成(DataInLong)源于腾讯开源并孵化成功的 ASF 顶级项目 Apache InLong(应龙),依托 InLong 百万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程,在跨云跨网环境下提供可靠、安全、敏捷的全场景异构数据源集成能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档