协调单细胞群体中的细胞类型,并将它们组装成一个共同的框架,是构建标准化人类细胞图谱的核心。2023年12月,《Cell》发表了一种基于树的预测聚类工具——CellHint,用于解决数据集之间在注释分辨率和技术偏差方面的细胞类型差异。
图形概要
CellHint是什么?
CellHin是一种基于树的预测聚类(PCT)工具,通过评估细胞-细胞相似性和统一细胞注释来有效地对齐多个数据集。在此基础上CellHint定义了细胞类型之间的语义关系,并捕捉到其潜在的生物学层次结构,从而进一步利用这些层次结构指导不同注释粒度的下游数据整合。
CellHint的框架
CellHint通过两个主要步骤推断数据集中的细胞类型关系:预测细胞之间的距离并总结细胞类型之间的比对。
CellHint的性能测试
开发团队已在49个数据集上应用了这一流程,证实了其在数据协调和整合方面的有效性,并为更广泛的领域提供了器官图谱和机器学习模型集,用于自动细胞类型注释。
CellHint协调概括人工注释
为了验证CellHint中的协调流程,开发团队选择了五个免疫数据集,尽管五个数据集中存在各种干扰因素,CellHint还是能够从两个互补的角度重建它们之间的细胞类型关系;CellHint还发现了以前被忽视的新细胞类型。
同时还收集了五个单细胞和单核数据集测试了CellHint处理单细胞转录组学范围之外的数据集的能力:CellHint揭示了高层次和低层次水平的42种和55种细胞类型,其中绝大多数与基于转录组的细胞类型比对相呼应。
CellHint协调概括了五个免疫数据集的人工注释
CellHint解开富含疾病的细胞状态
将CellHint应用到四个患病肺部数据集,成功地协调了不同区室中的细胞类型,解开了多种疾病中的异常细胞状态,揭示了其潜在的病理特征,并促进了转录组变化的全面研究。
CellHint协调患病细胞状态以发现分子变化
通过CellHint进行细胞重新注释和数据集成
通过CellHint统一模块对细胞进行重新标注后,CellHint还提供了一个整合模块,以调整数据结构,使之符合统一的细胞类型,同时以高效的方式减轻批次混杂因素的影响。
CellHint支持细胞再标记和监督数据集成
CellHint组装了成人海马体的完整图谱
开发团队使用CellHint组装了六个单核转录组数据集,对成人海马体进行了分析,重建了51种细胞类型的全局空间图谱,根据分子和推断的空间信息绘制了详细的成人海马图,以帮助解释细胞类型。
CellHint组装了高度集成的成人海马体图谱
用于细胞协调、整合和分类的多器官参考图
开发团队总共编制了38个单细胞和单核转录组数据集,分析了来自369名成人捐献者12个组织和器官的3,694,864个细胞,包括血液、骨髓、心脏、海马、肠、肾、肝、肺、淋巴结 、胰腺、骨骼肌和脾脏。在CellHint中应用自动化流程后,生成了12个标准化器官参考图,可在https://www.celltypist.org/organs上获取。
细胞类型协调、整合和分类的标准化多器官资源
CellHint文档可在如下链接获取:
👉 https://cellhint.readthedocs.io/en/latest.
//
此篇文献成果属于Human Cell Atlas项目的一部分,建议对技术细节感兴趣的小伙伴请参考文献原文~
对于文献整理过程中有翻译不当或错误也欢迎大家在评论区留言指出,互相交流学习!