前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >SCP—为单细胞分析设计的端到端解决方案

SCP—为单细胞分析设计的端到端解决方案

作者头像
生信技能树jimmy
发布2023-09-21 14:35:29
8700
发布2023-09-21 14:35:29
举报
文章被收录于专栏:单细胞天地

单细胞时代刷新了微观世界下观察的分辨率,也让科学研究更接近于真相。

尽管如此,单细胞也更暴露出了比以往bulk测序研究更多的问题。

技术层面上的问题例如基因究竟在一个细胞中表达与否、数据集之间的批次效应如何消除,等等;生物层面上的问题例如如何定义一个细胞类型或状态、细胞从哪来到哪去、基因或细胞之间是如何协同的,等等。

然而一旦模糊的界限被打破,就已无法回避。

生信的开发领域中已经诞生了大量优秀的算法、软件,来解决上述的各类问题。但如同机器学习领域一样,许多算法存在有限的泛化能力,导致在生信的应用领域中,会在错误的时刻发生错误的调用及解读。

作为生信应用研究人员,此时想回答生物学层面的问题就需要同时回答技术层面的问题,这种”既要又要”无疑在迫使生信分析人员转变角色,成为真正的左手技术、右手生物的生信科学家。

这里的”技术”强调下,它并不指代编程能力,也不指代算法开发上的能力,而是指一种在”生物信息”角度上对科学的辩证思维:时刻围绕着中心法则构建和完善生物世界观,并对所有生物数据是如何产生的、如何反应生物本身等进行不断的质疑与推断,学习理解常用算法背后的原理及其缺陷,避免让自己陷入黑盒。

最终,结合产生数据的技术背景和生物学背景,借助各类工具全方位、多角度的探索数据,才可以在分析中有效推断出微观世界所发生着的各类事件,才可以对上述问题做出更自信的回答。


SCP (Single-Cell Pipeline)

SCP是一个端到端单细胞数据分析管道,可实现数据从下机后的处理、分析、共享和发表的全部工作。管道意味着极简、标准化、模块化,SCP的特点是简洁、全面、高效,让单细胞的科学研究更专注于科学本身。

SCP中的所有方法根据分析类型主要分为三个模块,包括了数据预处理模块、下游分析模块和可视化模块。借助reticulate[1],SCP也在内部创建了一个python环境环境来整合python相关的工具和方法,让其在R/Rstudio中即可完成调用和结果解析。

SCP中的所有方法均围绕Seurat对象(Seurat V4)开发,虽然如此,利用转换函数adata_to_srt()我们依然可以在任意时候从python中的经典的AnnData[2]对象出发(.h5ad)。


SCP各模块内容

前处理:

  • 4种doublets鉴定方法(scDblFinder, scds, Scrublet, DoubletDetection)
  • 多种指标下的综合质控(doublets, outlier, umi, gene, mito, ribo, ribo_mito_ratio, species)
  • 标准的单细胞处理流程(Normalization, Feature selection, Dimension reduction, Clustering)
  • 11种批次矫正的单细胞整合处理流程(Seurat, scVI, MNN, fastMNN, Harmony, Scanorama, BBKNN, CSS, LIGER, Conos, Combat)
  • 5种线性降维和8种非线性降维方法

下游分析:

  • 20多种基因注释数据库、多物种、多基因ID类型的自动构建方法
  • 4种差异基因鉴定流程(All, Paired, Conserved, Distrubed)
  • ORA和GSEA两种富集分析方法
  • 3种特征打分方法(Seurat, Ucell, AUcell)
  • 5种细胞映射方法(KNNMap, PCAMap, SeuratMap, CSSMap, SymphonyMap)和3种细胞自动注释方法(KNNpredict, scmap, SingleR)
  • 7种细胞轨迹推断方法(Slingshot, PAGA, scVelo, Palantir, Monocle2, Monocle3, WOT)和基于pseudotime的动态特征鉴定方法

可视化:

  • 200多种离散型和连续型调色板
  • 两种常用的绘图主题,分别用于分析和发表
  • 图片的后期调整和格栅化方法
  • 20多种绘图函数,可绘制上百种图像类型
  • 快速构建交互式的单细胞数据查询网页SCExplorer

更多细节将在后面的教程中说明,敬请期待。

文中链接

[1]

reticulate: https://github.com/rstudio/reticulate/

[2]

AnnData: https://github.com/scverse/anndata

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-09-20 21:00,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • SCP (Single-Cell Pipeline)
  • SCP各模块内容
    • 前处理:
      • 下游分析:
        • 可视化:
          • 文中链接
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档