前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力

Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力

作者头像
智药邦
发布2024-03-19 12:38:48
1570
发布2024-03-19 12:38:48
举报
文章被收录于专栏:智药邦智药邦

2024年1月13日,西北工业大学尚学群教授、彭佳杰教授团队,在Briefings in Bioinformatics上发表文章Predicting drug–target binding affinity with cross-scale graph contrastive learning。

作者提出了一种新的跨尺度图对比学习方法CSCo-DTA(Cross-Scale graph Contrastive learning approach for Drug-Target binding Affinity prediction),用于药物靶点结合亲和力预测。该模型利用图神经网络分别基于药物-靶点二部网络和分子图,从网络水平和分子水平两个角度获得药物和蛋白质的特征表示,从而结合了分子尺度和网络尺度的特征,从局部和全局角度捕获信息。CSCo-DTA采用对比学习框架集成两个尺度特征之间的信息,探索它们之间的潜在关系。结果表明,所提出的模型优于现有的药物靶点结合亲和力预测方法。

背景

确定药物与其靶点之间的结合亲和力在药物发现中至关重要。尽管研究者们已经提出了许多计算方法来理解这些相互作用,然而,现有的方法大多只利用药物和靶点的分子结构信息或药物-靶点二部网络的相互作用信息,可能无法结合分子尺度和网络尺度的特征来获得高质量的表征。

方法

CSCo-DTA利用图神经网络编码器提取分子尺度和网络尺度特征,并通过跨尺度图对比学习组件最大化这两个尺度特征之间的信息。图1展示了所提出模型的框架,该模型包括四个部分:分子尺度图表示学习组件(图1A、C)、网络尺度图表示学习组件(图1B)、跨尺度图对比组件(图1D)和药物靶点亲和力预测组件(图1E)。

图1 CSCo-DTA结构图

如图1A, 1C所示,为了提取分子水平的特征,将药物和靶点蛋白质分子建模为无向图。对于药物分子图,图中的节点和边分别表示原子和原子间的键。对于蛋白质分子图,图中的节点和边分别表示残基和残基之间的接触。利用图卷积网络(GCN)对分子级图的拓扑结构进行编码。

对于药物的原子,初始特征包括几个性质,包括元素类型、成键数、附着氢原子的数量、价态以及原子是否为芳环。基于初始原子特征和分子图结构,使用GCN学习每个原子的嵌入向量,并通过读出函数获得药物分子的表示。GCN采用邻域聚合策略,通过迭代地聚合相邻原子和自身的嵌入来生成每个原子的特征表示。对于靶点的残基,初始特征包括位置特定分数、残基类型、残基是否包括芳环、残基权重等。类似地,GCN可用于对氨基酸残基的特征聚合操作。通过这种分子水平的特征提取,可以从微观角度获得药物和蛋白质的特征表示。

网络药理学理论从系统生物学的角度对药物与靶点的相互作用进行建模。这也证明了交互信息在药物靶点网络中的重要性。在药物靶点网络中,药物和靶点被表示为图上的节点,它们之间的连接被认为是边,这对应于观察到的特定药物和靶点之间的相互作用。在DTA网络中,边的权重是药物-靶点结合亲和力分数的归一化值。如图1B所示,CSCo-DTA利用图卷积网络(GCN)在DTA二部网络上进行特征提取操作。该操作的实质是在谱域对图信号进行动态滤波,得到低频信号作为网络中药物和靶点的特征表示。GCN从节点的邻域中聚合信息,并通过变换矩阵对聚合后的嵌入进行变换。在迭代过程中,网络中的每个顶点逐渐从其高阶邻居处获取信息。

基于分子尺度的嵌入和基于网络尺度的嵌入从不同的角度表征了药物和靶点的特征,两者之间可能存在一定的联系。为了结合分子尺度和网络尺度增强特征表征,CSCo-DTA提出了一种基于不同尺度的跨尺度图对比学习方法来建模嵌入。如图1D所示,通过基于图神经网络的方法获得不同尺度的药物表征后,首先将它们映射到同一特征空间,之后,利用对比学习方案来优化表征。

给定一种药物作为对比学习中的锚点(anchor),其表示应该与正样本一致,并在不同尺度上与负样本不同。跨尺度图对比学习的关键挑战之一是定义给定锚点的正样本和负样本,以提供自监督信号。一般来说,给定药物或靶点的表示基于网络尺度学习,其从分子尺度学习的表示可以定义为正样本。在本研究中,为了生成更多正样本对,作者提出了一种新的采样策略,包括基于分子特征的采样和基于网络结构的采样。

对于基于分子特征的采样,其思想是具有相似分子结构的节点被认为是高度相关的,可以用作正样本对。具体而言,使用PubChem结构聚类工具计算分子水平药物-药物相似度,采用Smith-Waterman算法计算蛋白质序列相似度。药物-药物相似性和蛋白质序列相似性都是分子水平的信息。对于基于网络结构的采样,其思想是网络中共享共同邻居的节点是相关的。CSCo-DTA提出了一种基于元路径的方法来计算药物之间的相似度。药物之间的相似度定义为药物-靶点-药物之间在药物-靶点网络中的元路径数,类似地得到目标相似度。按照上述方法,根据分子水平和网络水平的观点选择每种药物和每个靶点的正样本对。对比学习的训练目标,是使得正样本对的表示尽量相似,负样本对的表示尽量不同。

在上述的方法中,CSCo-DTA从两个不同的尺度学习药物和靶点的表示,并将它们投影到表示空间。这就产生了药物和靶点的两组表示⁠。如图1E所示,为了得到药物-靶点对的最终表示,将两个视图的映射嵌入连接起来。

CSCo-DTA在训练过程中利用原始的配对DTA数据引入了基于监督的损失,以及基于跨尺度对比的损失。这种方法使CSCo-DTA能够充分利用现有的标记DTA数据,并最大限度地发挥其潜力,通过将跨尺度对比训练目标纳入DTA预测任务中,对两个目标进行了联合优化,提高了训练过程中药物和靶点的表征准确性。

结果

作者将CSCo-DTA与一些具有代表性的方法进行了比较。如表1所示,将MSE和r2作为评估指标,更低的MSE和更高的r2说明性能更好。为了说明对比学习的效果,作者还列出了在不加入对比学习损失时的模型(称为CSCat-DTA)的结果。结果表明,CSCo-DTA取得了最优结果,CSCat-DTA取得了次优结果。

表1 与其他方法对比

作者设计了消融实验。除了对模型是否进行对比学习做比较之外,还分别测试了模型在去除分子尺度的特征和网络尺度的特征时的MSE。在去除分子尺度特征方面,用随机初始化的值替换了原始的原子和氨基酸节点特征。在去除网络尺度的特征方面,通过用随机初始化的向量替换网络节点特征,通过用0-1二值替换网络中的边权值。如图2所示,结果证明了不同尺度特征、多尺度特征融合和对比学习对于CSCo-DTA的重要性。

图2 消融实验

作者还进行了案例分析。CSCo-DTA预测了厄洛替尼(Erlotinib)的潜在靶点。厄洛替尼是一种酪氨酸激酶受体抑制剂,用于治疗晚期或转移性胰腺癌或非小细胞肺癌。已知厄洛替尼可与靶受体EGFR结合并抑制其活性。根据CSCo-DTA的预测评分对蛋白质靶点进行排序,得到厄洛替尼的潜在靶点,发现预测评分最高的前10个靶点中有9个的预测值排名与其实验活性排名一致。为了进一步验证,通过LibDock对剩余靶点IRAK4进行了分子对接,其对接得分为118.115,而EGFR的对接得分为122.603,这表明该药物与IRAK4之间可能存在相互作用。对接结果如图3所示,表明IRAK4与靶点的氨基酸残基形成分子间作用力。此外,作者还使用另一种方法GraphDTA进行了相同的实验。GraphDTA预测结果表明,IRAK4不包括在厄洛替尼的前10个预测靶点中。这也说明了CSCo-DTA能够预测出现有的机器学习模型未能发现的药物靶点。这些发现为厄洛替尼的作用机制及其在其他疾病治疗中的潜在应用提供了有价值的见解。

图3 案例分析

总结

在本文中,作者提出了CSCo-DTA方法来预测药物与靶点的结合亲和力评分。该方法通过学习药物-靶点亲和力网络的表征来模拟药物和靶点之间的相互作用。此外,CSCo-DTA利用GCN提取药物或靶点的分子级特征,并采用对比学习框架捕捉网络级和分子级视图之间的潜在关系,使学习到的表示更具信息性和集成性。最后,CSCo-DTA使用多任务训练策略来优化模型。评价结果表明,CSCo-DTA的性能优于其他方法,并体现出在药物发现中的应用潜力。

参考文献

[1] Wang et al. Predicting drug–target binding affinity with cross-scale graph contrastive learning. Brief Bioinform. 2024

--------- End ---------

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档