前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PNAS | 利用非结构数据预测蛋白质-配体复合物的结构和亲和力

PNAS | 利用非结构数据预测蛋白质-配体复合物的结构和亲和力

作者头像
DrugAI
发布2022-01-13 14:57:12
7690
发布2022-01-13 14:57:12
举报
文章被收录于专栏:DrugAIDrugAI

编译:蒋立坤 审稿:蒋长志

今天给大家带来的是来自斯坦福大学,计算机科学系和化学系的文章《Leveraging nonstructural data to predict structures and affinities of protein–ligand complexes》利用非结构数据预测蛋白质-配体复合物的结构和亲和力。在过去50年里,大量的工作致力于使用计算的方法预测与大分子靶标结合的小分子。此类方法对药物设计至关重要,主要分为两大类:基于物理的方法,根据给定目标的三维(3D)结构直接模拟配体与受体的相互作用;基于配体的方法,预测配体特性并给出相似配体的实验测量值。作者提出了一个统计学框架结合这两种信息,并且开发了一种方法预测与靶蛋白结合的配体的3D结构,该方法利用与目标蛋白结合没有3D结构的配体信息。这种基于物理和配体的组合建模方法提高了药物靶蛋白结合位置预测的准确性。使用这种框架,作者开发了一种候选药物的虚拟筛选方法,该方法结合基于物理和基于配体的方法。结果表明,通过机器学习方法结合不同的信息可以改善对配体性质的预测。

1

背景

小分子配体与蛋白质的结合是生物学中最基本的过程之一,绝大多数药物通过与靶蛋白结合来发挥作用。预测蛋白质-配体相互作用的特性—包括三维(3D)结构、结合亲和力、结合动力学、选择性和功能效应—对于药物的合理设计和解决分子生物学中的重要问题都至关重要。因此,大量工作集中在开发计算方法来预测这些属性。

计算方法一般分为两类:“基于物理学”的方法使用靶标蛋白质的3D结构,利用蛋白质-配体相互作用的物理学理解。“基于配体”的方法使用配体的给定特性(例如亲和力值),使用模式匹配来预测其它配体的相应特性。作者提出了一个严格的统计学框架,结合了基于物理和基于配体的方法。作者开发了ComBind,是一种通过利用现成的非结构数据来改进对配体在目标蛋白质上的结合位置的预测方法。

确定配体的结合位置---- 配体原子与靶蛋白结合的3D坐标 ---- 对于基于结构的配体药理特性优化以及了解配体如何影响靶蛋白至关重要。药物化学家长期以来一直使用先导化合物的结合位置作为参考,选择结合的类似物。结合位置也可以辅助预测配体特性,如亲和力和选择性等。正因为了解配体结合位置如此重要,研究人员需要花费数月或数年来解析配体与蛋白复合物的结构。由于实验解析耗时耗力,因此之前的大多数方法是基于计算的docking方法。这些方法是基于物理学理解:给定目标蛋白质的结构,它们对候选的配体位置进行采样,并使用每个位置的能量偏好和评分函数对这些位置进行排序(通常使用原子间相互作用,如:氢键和范德华力)。尽管在过去开发了数十种docking方法,但对于测试配体结构明显不同的配体,其预测位置的准确度通常很差。

图1,A 标准的docking方法将配体的化学结构和目标蛋白的3D结构作为输入,并使用配体评分函数预测结合位置。B ComBind还考虑了已知的目标蛋白质的其它配体(结合位置未知)的信息,从而可以更准确的预测。

ComBind通过利用已知的目标蛋白质的其它配体(结合位置未知)的信息提高了配体位置预测的准确性。而靶蛋白配体信息的收集要比3D结构信息收集容易的多。事实上,此类数据通常是在药物开发过程中收集的,并且已经公开在开源在数据库中(ChEMBL)。药物化学家早就认识到不同的配体以相似的姿势结合给定的靶蛋白。即使不共享相同子结构的配体也可以与目标蛋白质形成相似的相互作用。这种认识可以从物理学角度解释,例如:蛋白质-配体氢键的结合能量取决于所涉及的蛋白质原子的迁移率以及它们在没有配体的情况下与水形成氢键的能力。这些因素对不同配体的结合有相似的贡献,但很难单独的从静态蛋白质结构中预测。

图2,与给定的靶蛋白结合的不同配体在相似的位置结合,A 显示的是与mineralocorticoid receptor 盐皮质激素受体结合的三个配体(数据库id:2AA2,5L7E,5MWP);B 在3115对配体中,正确位置的相互作用相似性通常高于按照配体评分函数得到的排名靠前的配体对;C 在具有共享子结构的一组690个配体对中,子结构正确位置的相似性往往比其它预测位置更相似。

2

方法和结果

作者使用docking方法Glide软件包进行配体评分和位置采样方法。Glide是一款广泛应用于制药行业并且是目前研究中较准确的一种docking方法。作者首先量化药物化学家的直觉,即不同配体在结合相同的靶蛋白时往往会有相似的结合坐标(图2)。这种相似性包括:不同配体结合坐标的相似性(蛋白质-配体相互作用的相似性)、正确坐标与配体docking预测软件预测的排名靠前的其它坐标的相似性(常见配体亚结构位置的相似性)。作者使用28个靶蛋白,结合不同的小分子,得到了385个蛋白质-配体复合结构。然后使用Glide计算每一对蛋白质-配体,选择排名前100的docking坐标。对于每个靶蛋白的所有配体,作者计算配体的每个坐标与另一个配体的每个坐标之间的相似性。然后构建相似度值的概率分布,并将此分布成为参考分布。作者还计算了每个一致正确的坐标之间的相似性(每个配体一个坐标),其中如果坐标与实验确定的坐标在2.0 Å RMSD 之内,则该姿势被认为是正确的。作者使用这些数据作为计算相似度值的第二个概率分布,即原生分布,在计算原生分布式,使用Glide生成的列表中的正确坐标,而不是直接使用实验确定的坐标。

ComBind:由非结构数据信息预测结构预测

ComBind识别配体结合坐标的预测方法:给定一个配体和一个靶蛋白,具体的预测方法包括:

  • 得到靶蛋白的已知其它配体(从ChEMBL数据库中查询得到),作为辅助配体;
  • 计算要查询的配体和辅助配体的docking对接方式,生成候选坐标和对接得分;

计算ComBind得分,根据最小得分得到确定结合坐标;具体的:

对于查询的配体的每一种结合位置:公式的第一部分由Glide 计算每一种结合位置的得分,第二部分计算两个相似性得分一个是参考分布的相似性(分母),一个是原生分布相似性(分子),理论上原生分布的相似性要大于参考分布的相似性,二者相似性分为三种类型:hydrogen bonds, salt bridges, and hydrophobic contacts 。第二部分的作用是奖励与原生分布更相似的结合位置。(参见图2B,正确结合位置的配体之间更相似)。

3

实践

应用 ComBind 来预测 β 1肾上腺素能受体 (β 1 AR) 上配体的结合姿势,β 1受体是广泛用于治疗心脏病发作、心力衰竭和高血压的 β 受体阻滞剂药物的主要靶点。我们选择了11种已知可结合 β 1 AR 的不同配体,包括 β 受体阻滞剂和 β 激动剂。作者使用 Glide将 11 个不同的配体与晶体学 β 1 AR 结构对接,为每个配体产生多达 100 个候选姿势。然后,根据最小ComBind得分找到了一组的配体结合坐标。β 1 AR的结合位置由这11个配体确定。

图3,Combind发现不同配体之间结合坐标。

4

ComBindVS

ComBindVS定义: Deep Integration of Physics-Based and Ligand-Based Modeling for Virtual Screening and Binding Affinity Prediction深度集成基于物理和辅助配体的方法进行虚拟筛选。

作者使用相同的统计框架开发ComBindVS:给定靶蛋白的结构、一组已知的与靶蛋白结合的配体信息(作为辅助配体,ComBind需要多个)和待筛选的分子库。具体如下:

  • 首先得到用于ComBind预测的辅助配体的潜在结合位置;
  • 对于候选分子,选择一个结合坐标,计算与辅助配体的ComBind得分,并筛选最优结果;
  • 对于每个候选分子的ComBind得分作为预测的亲和力。对于虚拟筛选,候选药物的排名使用预测得分进行排序。

值得注意的是,ComBindVS 集成了基于物理学和基于配体的建模,不仅可以预测候选分子的位置,还可以根据这些分子的预测位置预测这些分子的相对亲和力。ComBindVS 从辅助配体自动估计相互作用,而不需要任何关于它们的结合姿势的信息。

5

案例分析

为了进一步说明ComBind的应用价值,作者预测了三种抗精神类药物(匹莫齐特、苯哌啶醇和螺环哌啶酮)在其靶标 D 2 R 上的结合位置。了解这些结合位置有助于开发具有改进药理特性的抗精神病类药物。作者使用 Glide 和 ComBind预测了匹莫齐特、苯哌啶醇和螺哌酮以及工具化合物美司哌酮的结合坐标。对于 spiperone 和 mespiperone,ComBind 和 Glide 预测相似的姿势。对于匹莫齐特(pimozide)、苯哌啶醇(benperidol)二者的预测则不同。在提交这份手稿之前不久,出现了氟哌啶醇结合的 D 2 R 晶体结构。氟哌啶醇与这两种药物配体共享一个共同的亚结构,该亚结构在晶体结构和 ComBind 的预测中的位置相似,进一步支持这些预测的准确性。

6

讨论

作者指出提出的ComBind 和 ComBindVS 是广泛适用的。对于大多数主要药物靶点,已经确定了许多结合剂。即使对于一个全新的目标,通常也会在药物发现项目的早期阶段通过高通量筛选识别出几种结合剂。即使给定很少的已知粘合剂,这两种方法也能显着提高准确性。结合坐标和亲和力预测在药物发现之外的许多领域都很重要。这些包括生物现象的研究,例如细胞信号(例如,激素和神经递质的结合)、感觉(例如,气味剂和调味剂的结合)、酶功能(例如,营养素和其他代谢底物的结合)和防御机制(例如,毒素和抗生素的结合)以及了解遗传变异对天然配体和药物反应的影响,这对个性化医疗至关重要。在这些情况中,通常已知多个配体结合感兴趣的靶蛋白,因此 ComBind 和 ComBindVS 可能被验证是有用的。

参考资料

Paggi, J.M., Belk, J.A., Hollingsworth, S.A., Villanueva, N., Powers, A.S., Clark, M.J., Chemparathy, A.G., Tynan, J.E., Lau, T.K., Sunahara, R.K. and Dror, R.O., 2021. Leveraging nonstructural data to predict structures and affinities of protein–ligand complexes. Proceedings of the National Academy of Sciences, 118(51).

代码

https://github.com/drorlab/combind

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-01-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档