前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >榕树集--使用强化学习自上而下的进行蛋白质结构设计

榕树集--使用强化学习自上而下的进行蛋白质结构设计

作者头像
DrugSci
发布2024-02-22 15:52:23
670
发布2024-02-22 15:52:23
举报
文章被收录于专栏:FindKeyFindKey

简介:

天然的蛋白质通常具有形状互补性来生成适合功能的体系结构,这是进化选择的结果,目前的设计方法无法实现。在本文中,作者描述了一种Top-down的强化学习方法:在整体架构和功能约束的条件下,通过Monte Carlo tree搜索来对蛋白质进行采样。作者在圆盘状纳米孔和二十面体的模型上进行了测试,实际结构和计算模型非常接近。

使用MC tree的backbone采样

作者使用了蒙特卡罗树搜索(MCTS)的算法,用于生成蛋白质复合物的主链结构。

这个算法直接从蛋白质片段中构建亚单位单体,并且针对预先指定的全局结构属性进行优化。在搜索过程中,每个步骤会在树的分支点上随机选择一小段蛋白质片段,并将其附加到主链的N端或C端。在每一步考虑的片段数量是学习速度和可生成结构多样性之间的权衡(片段数量较少时,每个选择的权重可以更快地学习,但随着每一步选择的数量增加,可生成的结构总多样性也会增加)。

作者使用参数化生成的helices作为building block来平衡这些影响因子。这些螺旋由单个参数(长度)完全描述,长度为9-22个AA,与短肽进行组合。短环会先聚类到316个bin中,一旦选择了一个环bin,会随机选择此簇内相关的环的主链。虽然这些局部结构比自然蛋白质结构中观察到的范围更为狭窄,但在初步探索中发现,从这些构建模块中可以轻松生成各种紧凑的蛋白质形状。通过这种方法构建100个残基的蛋白质主链需要约五个螺旋和四个环的添加,产生约1 × 10^17个可能性。

随后主链会进行评估,包括几何约束和得分函数。只有通过几何约束的移动才会被选中,并且在整个结构装配之前评估。完成的主链根据得分函数进行评估,并且会根据评估结果重新调整每个移动的选择概率。为了解决探索与开发之间的问题,搜索从多个独立的树开始,并限制任何一个移动的最大概率。最后,作者在蛋白质单体水平和对称纳米材料设计方面对该算法进行了测试,结果显示该算法能够生成符合预期形状和对称性的蛋白质结构。

Fig 1. Top-to-down计算策略以及计算流程

使用约束对称MCTS构建纳米孔

作为使用MCTS方法进行实验测试,将其应用于高度约束的设计,填充两个先前设计的环状蛋白环之间的空间,以生成具有中央纳米孔的盘状结构(图2A)。由于空间形状复杂、且要求没有大的空洞,传统的蛋白质设计方法很难直接解决这一挑战。作者采用了MCTS方法,通过在两个环之间的空间施加几何约束来限制搜索范围,以确保结果组装体中仅有内部C6环的孔。作者通过对不同内环尺寸的多种放置位置进行了MCTS搜索,并从中选择了满足设计标准的主链。最终,作者成功地生成了具有中央圆形孔的盘状结构,并且该结构的形状与设计模型高度一致。这项研究的结果表明,MCTS方法可以有效地解决高度约束的蛋白质设计问题,为未来的纳米孔传感应用提供了可能的解决方案。

Fig 2. 对称性的MCTS设计盘状纳米孔。

总结:

作者的自上而下的RL方法解决了以往基于自下而上设计方法无法解决的一些设计挑战。冷冻电镜结构证实了设计的54和67个残基的蛋白质可以组装成60个亚单位的二十面体,其内部单体和整体组装结构几乎与计算模型完全相同,并且由不同直径的循环蛋白环填充空间生成的圆盘状纳米孔。这些二十面体和盘状结构与任何先前设计或自然存在的结构都不同。这些结构无法通过以往的自下而上方法构建。MCTS方法以自上而下的方式指定的任何一组几何标准的能力为设计刚性支架免疫原或受体结合单体并相对精确地为它们的相互定位提供了一条途径,从而产生了强大的多价细胞受体激动剂和疫苗。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-02-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugSci 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介:
  • 使用MC tree的backbone采样
  • 使用约束对称MCTS构建纳米孔
  • 总结:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档