在单细胞PCA降维结果理解以及细胞聚类分群及其可视化中,除了有PCA以及聚类分群结果的可视化以外,都展示了一下UMAP图
UMAP图是运行完RunUMAP()的线性降维可视化结果,和RunUMAP()同样起非线性降维作用的还有RunTSNE()
在单细胞PCA降维结果理解中,我们运行完RunPCA之后,一共会保留下来50个维度,根据不同维度的相关性基因可以区分不同的细胞类群。但PCA通常只能显示数据的线性结构,不够直观。
可以使用t-分布邻域嵌入算法(t-SNE)或统一流形逼近与投影(UMAP)等非线性降维方法,在二维或三维图中为每个数据点提供一个位置,对高维数据进行可视化
常用的几个参数有:
降维结果也是存放在reductions里面
和PCA结果不同的是,TSNE降维的结果只有cell.embeddings里面是有数值的,储存着细胞的坐标信息,基于坐标信息可以进行可视化
可以使用Dimplot简单可视化tsne的二维结果图
在生信菜鸟团的#单细胞周更中,有一期就是对TSNE和UMAP图进行美化——tsne及umap图美化
使用ggplot2美化:
对比Dimplot直接绘图和使用ggplot简单调整之后的图:
当然还有更多的细节可以调整,Dimplot函数也有很多参数可以选择,后面我们再来探讨!
dim.embed
参数可以调整TSNE的维度,所以我们可以保留三个维度来进行可视化
三维立体图可视化就可以用到scatterplot3d——Plots a three dimensional (3D) point cloud这个包
tSNE三维可视化步骤:
从二维看起来,tsne和PCA的结果差异不算很大,但PCA结果中因为有feature.loding
的基因信息,所以不同维度根据其相关性基因可以对细胞亚群进行区分
从三维立体图看来,TSNE的降维后可视化的结果会更直观一些,相似的标签被聚类在一起
PCA
TSNE