简读分享 | 王宇哲 编辑 | 龙文韬
论文题目
CLADE 2.0: Evolution-Driven Cluster Learning-Assisted Directed Evolution
论文摘要
定向进化是蛋白质工程领域的一种革命性的生物技术,它通过昂贵的实验来搜索天文量级的突变空间,从而优化蛋白质的适应性。聚类学习辅助定向进化(CLADE)通过将非监督层次聚类和监督学习进行结合,有效地探索变异空间。然而,CLADE的初始阶段采样对所有的簇一视同仁,尽管许多簇包含大量的非功能性突变。最近的统计和深度学习工具使进化密度建模能够以无监督的方式访问蛋白质适合度。在这项工作中,本文构建了多个进化分数的集合来指导CLADE的初始采样。最终的进化得分增强CLADE称为CLADE 2.0,它使用进化驱动的聚类抽样在一个小的信息空间内有效地选择一个训练集。CLADE 2.0通过使用两个基准库进行验证,这两个库都有来自四个位点突变组合的160,000个序列。大量的计算实验与现有前沿方法比较表明,CLADE 2.0是一种新的机器学习辅助定向进化工具。
论文链接
https://pubs.acs.org/doi/10.1021/acs.jcim.2c01046
github链接
https://github.com/WeilabMSU/CLADE