大家好,这周推荐的是一篇nature biomedical engineering上发表的优化治疗抗体的文章,Optimization of therapeutic antibodies by predicting antigen specificity from antibody sequence via deep learning,通讯作者是来自苏黎世联邦理工大学生物系统科学与工程系的Sai T. Reddy教授,他的课题组主要研究系统免疫学。
治疗性抗体的优化需要大量的时间和资源,这主要是因为哺乳动物细胞中表达的全长抗体的低通量筛选(大约以千为单位),通常得到少量的优化前体。本文中作者展示优化的抗体突变体可以从大量不同的抗体序列空间中经由深度学习预测抗原特异性来识别。
为了产生可以用于训练深层神经网络的数据,作者利用CRISPR–Cas9介导的同源性定向修复引入定点突变,对在哺乳动物细胞系中表达的治疗性抗体trastuzumab(曲妥珠单抗)的文库(~万个突变体)进行了深度测序,并筛选了针对人表皮生长因子受体2(HER2)的特异性文库。
作者用了简单的one-hot编码,并比较了多种不同的机器学习模型,包括卷积神经网络(CNN)、支持向量机(SVM)、k近邻(kNN)、逻辑斯蒂回归(LogReg)、人工神经网络(ANN)、长短期记忆循环神经网络(LSTM-RNN)和随机森林(RF)等。最终根据表现选择CNN作为最终模型。
接着作者使用训练好的神经网络来筛选一个上亿个突变体的trastuzumab变体的计算库,并预测HER2特异性的子集(~百万),然后可以通过其粘度、清除率、溶解度和免疫原性进行过滤,以产生数千个高度优化的候选突变体。
而从未筛选文库中随机选择的30个变异体进行重组表达和实验测试,结果显示所有30个突变体也都保持对HER2的特异性。
本文作者展示了深度学习促进抗体工程和优化的强大能力。
本文作者:LY 责任编辑:Guo ZH 原文链接:https://www.nature.com/articles/s41551-021-00699-9 文章引用:DOI:10.1038/s41551-021-00699-9