第一层次降维聚类分群,我们通常是建议先在低分辨率的条件下对各个亚群进行生物学命名。如果是肿瘤领域的可以是如下所示的分类:
参考我五年前介绍过的 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。而且我们已经积累了心肝脾肺肾等多个器官的上皮细胞的细分亚群, 以及免疫细胞里面的髓系和B细胞细分亚群:
但是这样的人工手动对单细胞亚群进行检测一系列已知的基因的表达量的方式,工作量太大了。而且每个人的背景知识是不完善的,所以就衍生出来了一系列相关网页工具和知识库。今天我们要介绍的就是CellSTAR——单细胞转录组亚群标记基因注释数据库!
文章:Zhang, Y., Sun, H., Zhang, W., Fu, T., Huang, S., Mou, M., ... & Zhu, F. (2024). CellSTAR: a comprehensive resource for single-cell transcriptomic annotation. Nucleic Acids Research, 52(D1), D859-D870. https://academic.oup.com/nar/article/52/D1/D859/7321991
网址:https://idrblab.org/cellstar/
single-cell transcriptomic annotation resource (named ‘CellSTAR’) 针对现有的单细胞转录组数据进行了全面的整合。这些数据来自不同的项目和测序技术,包含了18个物种和139种组织。
cell marker是识别和分类细胞类型的关键因素。这个数据库搜集了canonical cell markers, which contain >80 000 entries covering over 80% of the cell types identified in 76% of the reference data
地址在:http://ftp.idrblab.cn/cellstar/download/Canonical_Marker.csv
image-20240201145148680
最后就是做了一些简单的可视化,帮助用户快速了解某个数据集: