简读分享 | 蒋一 编辑 | 李仲深
论文题目
Contrastive learning enables rapid mapping to multimodal single-cell atlas of multimillion scale
论文摘要
单细胞数据集的规模不断扩大,为处理扩大的规模、扩展的模态和不可避免的批量效应带来的计算问题。最近,基于深度学习的方法通过推导非线性细胞嵌入来解决这些问题。作者提出了细胞表征的对比学习--Concerto,它利用一个自我监督的蒸馏框架来模拟多模态单细胞图谱。通过区分每个细胞,Concerto可以适应各种下游任务(自动细胞类型分类、数据整合,reference mapping)。与目前的主流软件包不同,Concerto的对比性设置很好地支持对所有基因进行操作来保留生物变异。Concerto可以灵活地推广到多组学获得统一的细胞表示。在模拟和真实的数据集上进行基准测试,Concerto大大超过了其他竞争的方法。Concerto通过映射到全面的reference,Concerto再现了不同的免疫反应,并发现了COVID-19患者的疾病特定细胞状态。Concerto很容易并行化,并且可以有效地扩展,在1.5小时内建立一个1000万个细胞的参考,并在8秒内查询1万个细胞。
论文链接
https://www.nature.com/articles/s42256-022-00518-z