首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Nat.Biotechnol. | 单细胞数据集成的计算原理与挑战

今天给大家介绍由英国欣克斯顿,欧洲生物信息学研究所Ricard Argelaguet等人在《Nature Biotechnology》上发表了一篇名为“Computational principles and challenges in single-cell data integration”的综述。文中作者介绍了支持单细胞数据集成技术的基本概念,并讨论了用于链接不同数据集的锚的替代选择。此外,作者还回顾了单细胞数据集成策略的既定原则,局限性和诊断性,并强调了单细胞性状遗传分析方法和分子层间调控依赖性推断方法之间的相似性。最后,作者将基本的数据整合概念扩展到更具挑战性的未来应用,包括单细胞组学数据与物理维度(如空间和时间)的整合以及为个性化医疗构建人类变异参考图谱。

03

大数据时代的免费数据集成神器ETLCloud推荐

从数据治理的角度来看如何打破数据孤岛现是企业数据治理过程中最大的核心挑战。由于不同的业务部门和系统之间的数据相互独立,导致数据之间无法共享和利用,从而影响了企业的整体运营效率。IDC公司的调查显示,2022年,全球范围内有60%的企业面临“数据孤岛”的问题,企业无法高效、快速的从多个异构数据源中稳定汇聚数据。例如很多企业的生产部门和销售部门之间的数据无法共享,导致生产计划无法根据销售数据进行调整,销售订单也无法及时反馈到生产部门。这种数据孤岛现象导致企业生产效率低下,销售业绩也无法得到提升,要解决数据孤岛的问题,企业必须建立一个稳定、高效的全域数据集成平台。

02

Nature Methods | 单细胞基因组图谱数据集成的基准测试

本文介绍由德国计算生物学研究所的M. Colomé-Tatché和Fabian J. Theis共同通讯发表在 Nature Methods 的研究成果:作者对来自23篇出版物的85批基因表达、染色质可及性和模拟数据的68种方法和预处理组合进行了基准测试,总共代表了分布在13个图谱集成任务中的超过120万个细胞。作者使用14个评估指标,根据可伸缩性、可用性及其在保留生物变异的同时消除批次效应的能力对方法进行评估。研究表明,高度可变的基因选择提高了数据集成方法的性能,而数据缩放推动方法优先考虑批次去除而不是保留生物变异。总体而言,scANVI、Scanorama、scVI 和 scGen 表现良好,尤其是在复杂的集成任务上,而单细胞 ATAC 测序集成性能受特征空间选择的影响很大。该文免费提供的 Python 模块和基准测试管道可以为新数据确定最佳的数据集成方法,还能对新开发的方法进行基准测试。

01
领券