前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Seurat Weekly NO.07 || V4 新特性

Seurat Weekly NO.07 || V4 新特性

作者头像
生信菜鸟团
发布2021-02-03 16:31:19
6900
发布2021-02-03 16:31:19
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

天子呼来不上船, 自称臣是菜鸟团。

在这里,与国际同行一起学习单细胞数据分析。

最近(202101)安装Seurat(3.2.3)的话可能会收到一条提示信息:

代码语言:javascript
复制
Seurat v4 will be going to CRAN in the near future;
 for more details, please visit https://satijalab.org/seurat/v4_changes

我们介绍过的SeuratV4版就要通过CRAN的规范,可以在CRAN上直接安装了,这意味着V4走出了内测版本,以更成熟的方式提供给广大单细胞研究的科学家。我们在Seurat4.0|| 单细胞多模态数据分析启示录系列笔记中学习了V4整合多模态数据的过程,我们应该记得V4在预印的文章:Integrated analysis of multimodal single-cell data。

除了以上新功能的集成,Seurat还做了已有函数的小改动,大部分只是性能的提升,尽可能地保证了与Seurat V3 的兼容性。这些修改包括对默认参数设置的微小更改以及为相同任务使用性能更好的包,例如标识k最近邻居和基于图的聚类方法实现。这些变化不会对下游结果产生负面影响。

默认参数的改变

这当然是值得注意的,在不少时候会困惑:为什么同样的代码,同样的数据,在小明那里是这样的,而我是另一个样!默认参数/随机种子都是可能的原因,或者没有仔细检查数据和代码(也就是你说的一样,其实并不一样)。

  • FindNeighbors

用于识别k近邻的默认方法被设置为annoy。这是一种近似最近邻方法,广泛应用于高维分析,包括单细胞分析。广泛的社区基准测试表明,annoy极大地提高了邻居发现的速度并减少了内存需求,对下游结果的影响可以忽略不计(当然会有些许不同),这与我们的分析和测试是一致的。用户可以使用nn.method=”rann”切换回原来的默认设置。

代码语言:javascript
复制
?FindNeighbors 
## Default S3 method:
FindNeighbors(
  object,
  distance.matrix = FALSE,
  k.param = 20,
  compute.SNN = TRUE,
  prune.SNN = 1/15,
  nn.method = "rann",  # V3 的默认
  annoy.metric = "euclidean",
  nn.eps = 0,
  verbose = TRUE,
  force.recalc = FALSE,
  ...
)
  • FindMarkers

我们重新构造了FindMarkers()函数的代码,使其更易于理解、解释和调试。差异表达的结果保持不变。然而,在默认情况下,我们现在使用的FC(fold change )则基于log2,这在其他差异表达包中是常见的,而不是V3之前的自然对数。如果设置了默认选项,FindMarkers()的输出将包括列avg_log2FC,而不是avg_logFC。用户可以通过指定base = exp(1)来恢复以前的行为(以自然对数味为底的FC)。

  • IntegrateData/TransferData

我们对锚点加权矩阵(anchor weight matrix)的精确计算做了微小的改变。这些更改反映了改进的工作流,但不会对下游分析产生有意义的差异(例如,您可以使用Seurat v3和Seurat v4来比较)

  • SCTransform

在SCTransform()中,我们稍微修改了默认参数,以提高大型数据集参数估计的可伸缩性(scalability )。例如,在估计mu和theta之间的正则关系时,我们通过将ncells参数设置为5000来计算数据子集。sctransform v0.3中的vst()函数(可在CRAN上获得)还对正则化过程进行了微小的更改。我们对这些更改进行了广泛的测试,发现在速度和内存方面有了实质性的改进,特别是对于大型数据集,而且没有对结果产生不利影响。用户可以比较使用Seurat v3和Seurat v4计算的SCTransform vignette的结果,或者在更大的数据集中设置ncells=NULL来比较结果。

移除的函数

The following functions have been removed in Seurat v4:

  • CreateGeneActivityMatrix replaced by GeneActivity in Signac
  • RunLSI replaced by RunTFIDF and RunSVD in Signac
  • ReadAlevin and ReadAlevinCsv moved to SeuratWrappers, see details here
  • ExportToCellbrowser and StopCellbrowser moved to SeuratWrappers

英国哲学家弗朗西斯·培根在1620年出版了《新工具》一书,原名《新工具或解释自然的一些指导》,并作为《伟大的复兴》的第二部分。我们相信任何一个学科门类,工具既是技术发展的缩影也是科学发展的推手,随着Seurat的迭代,我们也感受到了单细胞基因组学的发展轨迹。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 默认参数的改变
  • 移除的函数
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档