前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >BIB | 动态结构信息提升蛋白-蛋白相互作用预测能力

BIB | 动态结构信息提升蛋白-蛋白相互作用预测能力

作者头像
DrugAI
发布2022-03-25 13:40:54
8060
发布2022-03-25 13:40:54
举报
文章被收录于专栏:DrugAI

摘要

近日,德睿智药与湖南大学团队在顶级期刊《Briefings in Bioinformatics》(IF:11.6)上发表研究论文“Learning spatial structures of proteins improves protein-protein interaction prediction”。蛋白质的空间结构与其功能特性密切相关,在预测蛋白质-蛋白质相互作用中增加蛋白质空间结构相关信息能潜在提高模型预测能力。本文提出TAGPPI模型,融合蛋白质序列特征与AlphaFold2预测的结构信息提高蛋白-蛋白相互作用预测精度。德睿智药团队负责了研究部分AI模型的开发与验证。

以下为研究背景,方法,实验与结论

01

背景

破译与蛋白-蛋白交互(PPI)网络是未来十年基础研究和药物研发的重大挑战。几十年来,药物研发已经产生能够抑制与疾病相关的许多蛋白质靶标的活性分子,或者靶向于主要和复杂细胞途径的G-蛋白偶联受体。这样的分子可以用作干扰PPI网络的工具,并评估相关的细胞反应。历史上,制药公司将精力集中在靶向位于细胞表面或细胞内酶的GPCR上,因为这些靶标存在围绕其活性位点的空腔。然而,这些靶标通常在PPI网络中占据中心位置,其活动通常会影响与其相关的通路。设计蛋白-蛋白相互作用的特异性抑制剂可以代替PPI网络中高度互联节点多效抑制剂。因此,PPI网络的破译尤为关键。随着高通量测序技术的飞速发展,大量的生物数据可以更加容易获得。快速积累的生物数据为使用深度学习方法来预测PPI加速PPI网络破译,提供了坚实的数据基础。

深度学习用来做蛋白质相互作用预测的一般步骤为:选择一些对预测有用的特征(比如蛋白质序列信息、进化信息、物理化学特性等),构建训练和测试数据集,构建合适的神经网络提取更高级的蛋白质表征,在训练集上进行训练,在测试集上进行测试并评估模型的性能。由于蛋白质的空间结构与其功能密切相关,研究团队认为针对PPI预测问题,结合蛋白质结构信息,可潜在提高模型的预测性能。然而,已知结构的蛋白质数量有限,限制了基于结构的预测方法的应用,利用Alphafold2预测的蛋白质结构是一种新的尝试。本研究提出了一种端到端框架TAGPPI (图1),融合序列特征和结构特征以预测PPI。

02

方法

模型主要分为三部分,分别是序列特征提取、结构特征提取以及分类器。针对序列,通过堆叠1D CNN与池化层来获取一维空间上相邻氨基酸间的局部特征。DeepMind与EMBL-EBI合作发布了AlphaFold DB,提供了由AlphaFold预测得到的多个物种的蛋白质结构数据。作者将预测的结构转化为接触图,长度为L的蛋白序列,其接触图是L x L的对称矩阵C,由0和1组成,Cmn=1表示序列中第m和第n个位置的残基相互接触。转化而来的接触图,包含了氨基酸之间的空间关系。在Graph数据中,邻接矩阵也表示着节点间的连接关系。因此,作者将接触图作为邻接矩阵输入图神经网络,用堆叠的GAT来提取蛋白质的空间特征。最后,将序列和结构特征加权融合,输入分类器,得到预测值。

图一:TAGPPI模型图

03

实验

在实验部分,作者在多个数据集上进行验证。包括二元分类数据集:Yeast,E. coli,C. elegans,D. melanogaster以及多分类数据集:Multi-class dataset。表1所示的是TAGPPI在多个二分类数据集上的5折交叉验证结果。由实验结果可知,在不同物种的数据集上,TAGPPI都展示出了优越的表现。

表1:TAGPPI的二分类实验结果

表2中的实验结果展示的是TAGPPI与几种基于序列的方法的对比。与这些基于序列的模型相比,TAGPPI可以根据预测的接触图,有效地捕获长距离残基关系,而其他方法仅根据线性序列在局部提取相邻氨基酸的特征。

表2:TAGPPI和基于序列的方法在Yeast数据集上的性能比较

除了二分类任务,作者进一步对多分类任务进行了实验。Multi-class数据集包含七种蛋白相互作用类型。相比二分类,多分类任务的难度更大,更能体现模型性能。将TAGPPI与SCNN和PIPR在多分类数据集上进行对比,实验结果表明TAGPPI效果更优。

表3:多分类实验结果

04

结论

学习空间结构特征可以提高PPI预测任务的准确性。随着蛋白质结构预测方法的改进,三维结构在数量和质量上都会有实质性的发展,这一趋势或许将促使更多围绕结构特征的研究的开展。团队计划尝试将该策略应用于其他预测任务,如药物-靶点相互作用预测和蛋白质设计。

原文链接:https://doi.org/10.1093/bib/bbab558

代码链接:https://github.com/xzenglab/TAGPPIii

关于德睿智药

德睿智药是一家AI驱动药物研发公司。我们希望通过结合机器学习、计算化学、药物化学、分子生物学等技术,提高药物研发的效率及成功率,让更多疾病有药可医,更多患者重获健康。公司AI医药解决方案曾被欧美权威机构Deep Pharma Intelligence 评为“2018-2020全球最重要的11个AI药物研发突破性成就”之一。其自研第一条AI辅助设计药物管线在8个月内进入IND-Enabling Studies阶段。

更多信息请访问网站:mindrank.ai

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档