前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Structure | 评估AlphaFold2在肽结构预测上的表现

Structure | 评估AlphaFold2在肽结构预测上的表现

作者头像
DrugAI
发布2024-04-28 10:54:53
1190
发布2024-04-28 10:54:53
举报
文章被收录于专栏:DrugAIDrugAI

今天为大家介绍的是来自Alican Gulsevin团队的一篇论文。近期在计算工具方面的进展极大提升了对蛋白质结构预测的准确度。计算预测方法已经被用于许多可溶性和膜蛋白的建模,但这些方法在肽结构建模上的表现尚未进行系统性研究。

肽结构预测有多种方法,包括从头预测、同源建模、分子动力学(MD)模拟和基于深度学习的方法。PEP-FOLD3是一种特定于肽的从头折叠方法,可用于模拟5到50个氨基酸之间的肽。APPTEST是一种特定于肽的协议,结合了神经网络架构和MD,可用于模拟5到40个氨基酸之间的肽。AF2是一种基于深度学习的蛋白质预测方法,使用多序列比对(MSAs)来预测基于共进化残基的蛋白质结构。RoseTTAFold通过类似的逻辑但不同的深度学习架构工作。Omega-Fold是一种基于深度学习的方法,仅使用序列而不使用MSAs进行基于自然语言模型的预测。Omega-Fold在无法获得高质量MSAs的情况下表现出色。除这些方法外,当存在同源肽或蛋白结构时,可以使用同源建模,或者使用野生型实验数据来模拟蛋白质突变结构。虽然这种方法通常更适用于较大的蛋白质,但也被应用于肽结构的建模。然而,同源建模需要有与目标蛋白高序列同源性的模板结构。考虑到大多数自然肽可能只有序列信息可用,基于序列的方法比基于结构的方法有优势。理解当前肽预测方法的弱点将指导未来方法的开发。

图 1

AF2(AlphaFold2)的可用性是朝着高精度蛋白质结构预测迈出的一大步。虽然理论上AF2可用于较短肽的建模,但用于训练AF2的基准集排除了最短的肽结构,因为这些肽的确定方法通常是NMR(核磁共振)光谱学。AF2在CASP14中所做的一些相对较差的预测其中包括由NMR确定的蛋白质结构,这引发了一个问题:对于灵活的肽结构是否也会观察到类似的模式。因此,需要全面的基准来评估AF2在肽结构建模中的实用性。虽然正在进行关于评估AF2预测肽-蛋白质复合体结构的性能的工作,但AF2在小肽结构预测上的表现仍未被探索。在这项工作中,作者的目标是为使用AF2预测10到40个氨基酸长的肽的结构奠定基础,并将AF2的性能与其他肽预测方法进行比较。作者试图理解AF2是否适用于大规模建模通过实验方法难以获得的肽结构。为实现这一目标,作者从PDB中选取了588个肽,并进行了计算,预测它们使用AF2的结构(图1A)。接下来比较预测结构和实验结构,通过均方根偏差(RMSD)和F/J角度恢复来计算AF2预测性能。

数据选择

作者选取了588个肽,这些肽具有通过NMR结构实验确定的,包括定义良好的二级结构元素和无序区域。这些肽被分成以下基准集:α-螺旋膜相关肽(AH MP)、α-螺旋可溶肽(AH SL)、混合二级结构膜相关肽(MIX MP)、混合二级结构可溶肽(MIX SL)、β-发夹肽(BHPIN)和富含二硫键的肽(DSRP)。对于每个肽,NMR结构的整体与所有五个AF2结构进行了成对比较,所有成对的Ca RMSD分布被绘制出来,以确定异常值并检查预测不良的结构(图1B)。

实验部分

图 2

α-螺旋膜相关肽被预测得相当准确,且极少出现异常值。这些肽被定义为在膜环境存在时折叠成主要是α-螺旋结构的聚酰胺。这个组包括跨膜螺旋、两亲性螺旋、具有螺旋-转角-螺旋基序的结构,以及部分横跨膜的单体螺旋等肽。归一化的Ca RMSD的直方图显示为单峰高斯分布,平均值为每个残基0.098埃(图2A)。作者根据平均值之上的标准差(s)的数量检查了个别异常值,以了解AF2预测的结构短板。在某些情况下,AF2未能预测α-螺旋肽的螺旋末端和螺旋-转角-螺旋(图2B)。

与它们的膜相关对应物相比,α-螺旋可溶肽显示出异常值并且表现更差。归一化Ca RMSD的分布显示出一个双峰高斯,平均值为每个残基0.119埃,第二峰值位于平均值之上的2σ到3σ之间(图2C)。可溶性α-螺旋肽的异常值再次表明AF2在预测螺旋-转角-螺旋结构时遇到困难(图2D)。此外,对于1AMB,AF2完全未能预测α-螺旋结构,RMSD为每个残基0.369埃(图2D)。

图 3

混合二级结构可溶肽显示出中等准确度。混合二级结构可溶肽组被定义为具有与其膜对应物相同二级结构特性的肽,但这些肽的结构未在膜环境中被识别。归一化Ca RMSD直方图显示出一个适度多峰的高斯分布,峰值位于平均值之上的1σ、2σ和3σ处,平均值为每个残基0.107埃(图3C)。异常值表明AF2未能预测二级结构与无结构边界的方向(图3D)。例如,尽管NMR模型由整个集合中定义良好的紧凑结构组成,AF2预测2BBL为一个完全无结构的肽(图3D)。

图 4

富含二硫键的肽结构以高精度被预测,但在二硫键模式上有变异。在本项工作中,富含二硫键的肽(DSRP)被定义为任何具有两个或更多二硫键的肽。DSRP基准集中最大的一组,共包含266个肽。DSRP显示了一个紧密的、略微双峰的高斯直方图,峰值在平均值之上两个标准差的地方,每个残基0.068埃(图4C)。异常值未能预测正确的二硫键模式。3BBG正确预测了一个,并将大多数剩余的半胱氨酸残基放置在近处,2MSF放错了两个二硫键,并未能预测另一个的键合,而7L7A未能预测任何二硫键键合(图4D)。

图 5

作者试图了解AF2是否在预测肽的实验结构方面,相较于其他深度学习和从头蛋白/肽预测方法,具有优势。作者为基准集中的所有588个肽生成了预测,使用了PEPFOLD3、Omega-Fold、RoseTTAFold和APPTEST。PEPFOLD3和APPTEST被设计用于肽结构预测,而Omega-Fold和RoseTTAFold被设计用于一般蛋白质结构预测。AF2在预测肽结构方面,通过长度归一化的Ca RMSD测量,比所有其他肽组的替代方法表现得更好。有趣的是,AF2只在混合二级结构可溶肽上超过了APPTEST(图5E)。最后,AF2超过了PEPFOLD3、RoseTTAFold和APPTEST,但与Omega-Fold在混合二级结构可溶肽上的表现一样好(图5F)。

编译 | 曾全晨

审稿 | 王建民

参考资料

McDonald, E. F., Jones, T., Plate, L., Meiler, J., & Gulsevin, A. (2023). Benchmarking AlphaFold2 on peptide structure prediction. Structure, 31(1), 111-119.

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-04-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档