2025年1月7日,位于伯克利的生物技术公司Profluent Bio(成立于2022年,迄今已获得4400万美元的投资)发布了一个人工智能模型,旨在推进CRISPR-Cas基因编辑系统的设计。该公司的最新研究成果发表在2025年1月6日的预印本上,展示了如何利用深度学习,通过定制CRISPR复合物的DNA识别能力来扩大其基因组编辑潜力。
Profluent创新的核心是Protein2PAM,这是一个在超过45000个进化CRISPR-Cas数据集上训练出来的深度学习模型。该模型旨在预测和定制CRISPR酶的原位相邻基序(PAM)识别,这是决定这些系统可以编辑哪些基因组位点的关键因素。这项研究强调了Protein2PAM计算进化Cas酶的能力。
CRISPR-Cas-PAMs的系统鉴定
通过为特定的PAM定制Cas蛋白,Profluent的方法可以克服现有CRISPR系统的一个主要限制:其靶向范围有限。根据这项研究,Protein2PAM成功设计出的Nme1Cas9变体能够编辑以前无法访问的基因组区域,扩大了CRISPR技术在治疗和研究应用中的效用。
人工智能与蛋白质设计的结合
Profluent的基础模型利用人工智能设计受天然支架启发或从零开始创建的蛋白质。通过将计算工具与内部湿实验室能力相结合,公司将蛋白质设计步骤与具体的实际应用相结合,从而在应对生物挑战时实现了精确性和可扩展性。
来自Profiluent的技术概述
2024年8月,Profluent还推出了ProseLM(蛋白质结构编码语言模型),这是一种将结构和功能上下文纳入蛋白质语言模型的工具,用于有针对性的蛋白质设计。ProseLM利用添加到预训练语言模型中的适配器层,整合了原子级细节,如与核酸、配体和离子的相互作用。这种方法使ProseLM的计算效率很高,同时还能生成精确的、针对特定上下文的序列。
在实验验证中,ProseLM的碱基编辑效率比初始设计高出近50%,对治疗性抗体(如 nivolumab)的抗体结合亲和力提高了2.5倍。该模型建立在Profluent早先在OpenCRISPR-1上取得的成功基础之上,OpenCRISPR-1是一种可编程基因编辑器,于 2024年4月公开发布,用于研究和商业应用。
参考资料:
https://www.biopharmatrend.com/post/1093-profluent-unveils-ai-model-to-advance-crispr-cas-systems-for-gene-editing/