前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nat. Chem. | 通过深度学习设计靶向核的非生物微蛋白

Nat. Chem. | 通过深度学习设计靶向核的非生物微蛋白

作者头像
DrugAI
发布2021-08-24 10:41:29
4740
发布2021-08-24 10:41:29
举报
文章被收录于专栏:DrugAI

作者 | 杨崇周、刘南 指导 | 闵小平(厦门大学)

今天带来的是Carly K. Schissel发表在nature chemistry上的Deep learning to design nuclear-targeting abiotic miniproteins。现如今,巨大的氨基酸排列组合空间阻碍了人们通过传统方法进行功能性聚合物的设计。本文将展示利用高通量实验与受定向进化启发的深度学习方法相结合,并把自然和非自然残基的分子结构表示为拓扑指纹,重新设计非天然穿膜微蛋白(该微蛋白将反义二酰胺基磷酸酯吗啉代寡聚体 (PMO) 输送到细胞核)。结果表明,深度学习可以破译设计原则,以生成不太可能通过经验方法发现的高活性生物分子。

1

简介

受定向进化的启发,本文利用指纹序列表示来开发基于机器学习的生成器—预测器—优化器三元组。生成器生成序列后将序列置入预测器—优化器循环进行优化。其中生成器生成新的细胞穿透序列,预测定量器估计给定序列的活性,优化器朝着最优化的小蛋白序列进化。

生成器:

生成器:基于循环神经网络,该网络捕获CPP的本体并生成“类似CPP”的启动序列。使用嵌套的长短期记忆(LSTM)神经网络架构训练生成器。

预测器:

基于CNN,通过给定的肽序列估计PMO传递后的归一化荧光强度,该模型在残基的指纹矩阵上进行训练。

优化器:

来自生成器的序列被随机突变并针对目标函数进行评估,该目标函数使CNN模型预测的活性最大化,并最小化长度、Arg含量和与文库的相似性,同时保持水溶性,用净电荷估计序列。

微蛋白设计流程

1.用三种肽或“模块”的线性组合构建了一个包含600个独特翻译-小蛋白偶联物的文库。

2.使用体外测定实现定量活性读数,其中PMO的核传递使绿色荧光蛋白增强。

3.残基被编码为指纹以提供化学结构信息,用相应的活性数据标记并用于训练预测神经网络。

4.“CPP词库”数据集用于训练生成器神经网络,以生成“类似CPP”的新序列并用作优化种子。

5.在预测器-优化器循环中优化这些新序列,以增加序列的活性,同时最大限度地减少与文库的相似性,并最大限度地减少长度和Arg含量以减轻毒性。

图1 深度学习的训练流程

序列被编码到一个指纹矩阵中,标记有实验活性数据,并用于训练一个机器学习模型。该模型设计了一个基于定向进化的新循环序列。非自然残基包括Ahx(X)、β-丙氨酸(B)和通过脱氟联苯连接的Cys(C)大环。

2

结果

本文将CNN-FP模型在与其他回归模型一起进行训练测试,证明:RF 模型在验证数据集指标上略微优于原始 CNN;然而,众所周知,它仅限于在训练数据范围内进行预测。关于针对 Mach 数据集的测试,CNN-Onehot 模型优于 CNN-FP 模型。然而,在去除异常序列(CNN-FP 预测活性:140)后,CNN-FP 被证明是最佳模型。

图2 各种模型在不同数据集上的效果

(r和ρ分别表示 Pearson 和 Spearman 的相关性)

图3 EGFP试验中的活性和PMO-Mach3的

LDH试验中的毒性对应的剂量-反应曲线

图4 共聚焦显微EGFP、Mach3-EGFP

或Mach7-EGFP,在HeLa细胞中产生的绿色荧光

重新设计的微蛋白在体内外均具有高活性,并将其他生物大分子递送到细胞体中,微蛋白增强了PMO的传递,改善了EGFP(一种常用作为报告基因的荧光蛋白)的传递。

3

总结

本文展示了一种使用深度学习和标准化实验来有效地采样功能肽的巨大化学搜索空间的方法,解决了巨大的氨基酸排列组合空间阻碍了人们通过传统方法进行功能性聚合物的设计的难题。这种方法被应用于非天然微型蛋白的设计,该蛋白可以将反义PMO传递到细胞核,并非常高效地进行基于多肽的变异。这些微蛋白是多种多样的细胞内载体,可以将其他类型的生物分子,如荧光蛋白和酶,传递到细胞核和细胞质中。该方法的核心优势在于:(1)标准化的定量活性数据,(2)模型推断超出训练集的能力,(3)可以作为视觉解释模型决策过程的归因工具。

参考资料

Schissel, C.K., Mohapatra, S., Wolfe, J.M. et al. Deep learning to design nuclear-targeting abiotic miniproteins. Nat. Chem. (2021).

https://doi.org/10.1038/s41557-021-00766-3

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档