结直肠癌单细胞数据集也有十多个了,拿到表达量矩阵后的第一层次降维聚类分群通常是:
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。比如 EMBO Mol Med (2021) 的文章《 Mitogen-activated protein kinase activity drives cell trajectories in colorectal cancer 》,就是如此:
第一层次降维聚类分群
绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。
反而是上皮细胞,大家很少涉及到,但是结直肠癌既然是来源于结直肠这样的组织, 它的上皮细胞就不可能是一个纯粹的上皮,理论上是可以细分的。上面的这个文章其实也接下来部分细分,如下所示:
上皮细胞的细分亚群
可以看到,肿瘤的上皮细胞首先需要区分恶性与否,然后各自降维聚类分群和生物学命名,目前区分恶性与否比较权威的工具是infercnv。我们早期大量关于使用infercnv来推断肿瘤单细胞转录组数据里面的拷贝数的教程:
一般来说,恶性的肿瘤细胞分群只能是靠生物学特征,顺序编号即可,它不是正常细胞,异质性很大,也没有办法给出来一个通用的生物学名字。
但是正常的肠道上皮细胞有多种类型,包括肠吸收细胞、杯状细胞、Tuft细胞、潘氏细胞、肠分泌细胞等。
我在学徒作业:7种肠道正常上皮细胞亚群标记基因是否有可取之处也提到过,2021年发表在Cell 杂志的文章:《Differential pre-malignant programs and microenvironment chart distinct paths to malignancy in human colorectal polyps》把上皮细胞首先区分成为了恶性的癌症细胞,主要是:
以及正常的上皮细胞,normal epithelial cells包括:
如下所示的降维聚类分群:
另外,发表在Sci Adv, 2022的文章:《mA mRNA modification maintains colonic epithelial cell homeostasis via NF-κB-mediated antiapoptotic pathway》,是小鼠模型, 该研究有7863个上皮细胞进行单细胞转录组测序,降维聚类分群后进行生物学命名,如下所示:
降维聚类分群后进行生物学命名
可以看到是7个单细胞亚群,包括:
文章链接是:https://www.science.org/doi/10.1126/sciadv.abl5723 感兴趣的可以读一下,其单细胞表达量矩阵也是公开可以获取的,见:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE171423
我们整理了基因集,代码如下所示:
library(ggplot2)
genes_to_check = c( "OTOP2","MEIS1","KRT20","GUCA2A",
"ALDOB","MSLN","MUC5AC","AQP5","TACSTD2",
"FSCN1","TFF2","ANXA1","ANXA10","REG4","MUC17",
"S100P","GSDMB","GSDMD","L18","RELB","MDK","RARA",
"RXRA","AHR","AGRN","PDX1","CLDN2","CD44","AXIN2",
"RNF43","TGFBI","EPHB2","TEAD2","CDX2","LGR5",
"OLFM4","ASCL2","PCNA","MKI67","ATOH1",
"MUC2","TFF3","CHGA","NEUROD1","POU2F3","SOX9")
有意思的是,我把前面的 EMBO Mol Med (2021) 的文章《 Mitogen-activated protein kinase activity drives cell trajectories in colorectal cancer 》,里面的正常组织的上皮细胞拿出来进行细分的时候,发现是;
可以看到
剩下的,我就不一一举例说明了。可以看到, 这些基因还是蛮有效果的,在肠道上皮细胞的单细胞细分亚群水平。
当然了,这样的生物学认知还需要自己深入这个领域。
我给几个数据集给大家,去试试看,能不能从里面把上皮细胞拿出来,并且进行细分亚群,看看能不能有上面列出来的亚群。
其实这样的基础认知,也可以看基础10讲:
最基础的往往是降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释