前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nat. Mach. Intell. | 模块化深度学习实现了单克隆细胞系的自动识别

Nat. Mach. Intell. | 模块化深度学习实现了单克隆细胞系的自动识别

作者头像
DrugAI
发布2021-07-05 10:11:30
4840
发布2021-07-05 10:11:30
举报
文章被收录于专栏:DrugAI

编译|陈雨洁 审稿 | 杨慧丹

今天给大家介绍纽约干细胞基金会研究所的研究人员Brodie Fischbacher等人发表于Nature machine intelligence的一项研究工作《Modular deep learning enables automated identification of monoclonal cell lines》。在本项研究中,研究人员首次提出了模块化的深度学习框架Monoqlo来自动识别细胞集落,并从细胞成像中识别克隆性。

研究背景

单克隆化是指从培养群体中分离和扩增单个细胞,是细胞培养中的一个重要步骤。它可以最大限度地减少细胞系在细胞改变事件(如重编程或基因编辑)下游的技术变异性,也可以用于单克隆抗体的开发等过程。传统的验证克隆性的方法不能很好地扩展至对大群落的研究。用于事后评估克隆性的自动化、标准化方法的缺乏,也将使得单克隆化的方法无法在不加剧细胞系技术变异性的情况下可靠地扩大规模,从而给研究带来严重的障碍。

对此,纽约干细胞基金会研究所的研究人员提出了一个深度学习工作流的设计,该工作流程被称为Monoqlo。Monoqlo提供了一种完全可扩展且高度可解释的框架,能够在一小时内使用商用硬件分析工业数据量。通过利用细胞培养过程的时间方向性,标准化了单克隆化过程,能够扩大集落选择方案的规模,同时最小化技术变异性。

研究方法

(1)模块化的神经网络

研究人员训练了四个独立的神经网络--全局检测、局部检测、单细胞检测以及形态分类模块,每一个神经网络都拥有其自己的“模块化”功能(如下图1所示)。全局检测模块目的是在全孔图像中检测集落是否存在;局部检测模块是在不同放大倍数下对不同孔区域图像进行裁剪并进行集落检测任务;单细胞检测模块是在完全放大、裁剪的图像中对单细胞进行计数;形态分类模块是对集落区域周围裁剪的图像进行形态分类任务。研究人员通过使用基于focal loss的RetinaNet50检测结构来实现前三项任务,对于最后一个形态分类任务,作者选择使用ResNet34结构进行训练。

图 1 Monoqlo模块化CNN架构

(2)整体工作流程设计

研究团队设计了一个名为“Monoqlo”的计算工作流,其整合了上述训练好的神经网络。实验室自动化工作流程中集成了可以生成用于Monoqlo的数据以及Monoqlo的设计本身(如图2和3所示)。

图 2 生成Monoqlo数据的自动化流程

该模型以逆时针顺序的方式处理每个孔的图像,从最近的一次扫描图像开始,如果通过全局检测到集落的存在,输出任一检测到的集落所在的边界框的坐标,然后扩展该边界框的每个维度直到其是预测集落的两倍,再加载当前孔的上一次的扫描成像图并按照扩维后的坐标裁剪为结果区域。然后将得到的图像传递给局部检测模型,其会报告先前群落所处的边界框,当与最初裁剪坐标相加时,会指示其在原始未裁剪图像中的位置。该算法会递归地迭代这一过程,直至加载的最新扫描图像是分选后数小时内生成的最早的“day 0”的扫描。

图 3 Monoqlo算法设计流程

如果在这个过程中观察到两个或两个以上的明显不同的细胞团(它们被假定来源于相同的FACS分选的两个或两个以上的细胞),则通常可以直接判定为多克隆性。如果在全局或局部检测模型在按时间顺序向后迭代的过程中的任意时点上报告集落数大于1,该算法相应地也会宣布该孔为多克隆孔并停止处理该孔的任何进一步图像。如果工作流能够继续精确地检测一个集落,直到到达day 0的扫描,结果图像将被放大,并在(祖先)细胞周围精确地裁剪。然后可以将该图像传递给单细胞检测模型,提供起始细胞数的计数。在此基础上,该孔最终可被宣布是单克隆或多克隆性。

这种“孔剔除”的方法,可以在工作流中检测到任意一个排除标准,并使得算法能够从工作流中排除整个孔,并忽略对该孔的所有后续扫描。在实施部署的过程中,研究人员进一步扩展了排除标准,可以排除表现出分化形态标志的孔。由于需要进行日常分析的数据集非常庞大,作者提出的淘汰方法在计算时间方面也提供了巨大改进。

实验结果

研究人员通过可视化地比较需要验证的图像的标签和预测结果,并绘制出边界框,来人工评估模型的性能。其主要根据两个指标来量化检测的性能:一个是正确预测和分类的有标签对象的百分比;另一个则是模型检测到不存在对象的假阳率。其性能验证的结果如图4a所示, 其中外圈颜色代表孔的真实克隆性,内圈颜色代表Monoqlo模型识别的克隆性,如果存在双重颜色,则为预测错误。

Monoqlo作为一个统一的模块化的工作流程,研究人员先在人工管理的类平衡测试数据集上测试其特定类别克隆性识别性能,然后在一个原始的、未过滤的数据集上评估其克隆性识别性能,其结果如图4b所示。

图 4 Monoqlo框架性能评估

总结

单克隆化在细胞培养中是非常关键的一个步骤,但是它在诱导多能干细胞的生产过程中一直面临着瓶颈。对此,这项研究工作提出了一个全新的框架:Monoqlo,通过具有模块化设计的深度学习方法可以自动验证明视野显微镜观察中的单克隆性。研究团队还将其工作流程扩展至集落的形态分类,展示了自动化工作流程中自主监测单克隆细胞系发育和克隆选择的潜力。

参考资料

数据

https://nyscf.org/ open-source/monoqlo/

代码

https://github.com/NYSCF/monoqlo_release

Fischbacher, B., Hedaya, S., Hartley, B.J. et al. Modular deep learning enables automated identification of monoclonal cell lines. Nat Mach Intell (2021).

https://doi.org/10.1038/s42256-021-00354-7

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档