前些天我提到了一个很无聊的R包,名字是:scRNAstat ,它可以4行代码进行单细胞转录组的降维聚类分群,其实完全没有技术含量, 就是把 Seurat 流程的一些步骤包装成为了4个函数:
而且以PNAS杂志的一个关于AD的单细胞的数据集, https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE157827 为例子,展示了脑部各个单细胞亚群标记基因的代码:
根据这个AD的单细胞的数据集的文献《Single-nucleus transcriptome analysis reveals dysregulation of angiogenic endothelial cells and neuroprotective glia in Alzheimer's disease.》列出全新的基因, 可视化:
astrocytes = c("AQP4", "ADGRV1", "GPC5", "RYR3")
endothelial = c("CLDN5", "ABCB1", "EBF1")
excitatory = c("CAMK2A", "CBLN2", "LDB2")
inhibitory = c("GAD1", "LHFPL3", "PCDH15")
microglia = c("C3", "LRMDA", "DOCK8")
oligodendrocytes = c("MBP", "PLP1", "ST18")
gene_list = list(
Astro = astrocytes,
Endo = endothelial,
Excit = excitatory,
Inhib = inhibitory,
Mic = microglia,
Oligo = oligodendrocytes
)
这样的基因列表在很多脑部相关单细胞研究都有,我们十一月份的单细胞训练营小伙伴:
两个分组的脑部单细胞基因
可以看到,不同文章对同一个单细胞亚群给出来的标记基因往往是可以互补的!但是这些未必就足够,单细胞数据分析的时候细分领域背景知识太重要了。
早在2018的science文章《Molecular, spatial, and functional single-cell profiling of the hypothalamic preoptic region》就列出来了 区分神经元细胞的兴奋性和抑制性的基因:
从文章的细胞分群情况也可以看到,其实兴奋性和抑制性的神经元仍然是一个很大的统称,里面是可以大量细分亚群:
可以看到兴奋性和抑制性的神经元仍然是需要细分
所以更早(2017) 文章:《A molecular census of arcuate hypothalamus and median eminence cell types》就针对 20,921 cells里面的 13,079 neurons 进行了如下所示的划分:
但是它全部的20,921 cells 第一层次细分就有名有姓啦,如下所示:
而 2020的文章:《Classification of midbrain dopamine neurons using single-cell gene expression profiling approaches》总结的更多!
这两天看到了一个发表在:《Nature Neuroscience》的文章:《Diversification of molecularly defined myenteric neuron classes revealed by single-cell RNA sequencing 》不仅仅是将神经元亚群分为兴奋和抑制性运动神经元,还增加了中间神经元、内在初级传入神经元:
以上绝大部分研究都是根据释放的神经递质对转化的神经元亚型进行区分,特别是谷氨酸能和 GABA 能神经元,它们分别是大脑中主要的兴奋性和抑制性神经元。大多数 Neurog2 或 NeuroD1 转换的神经元是前脑谷氨酸能神经元,而 Ascl1 显示出 GABA 能神经元生成的趋势。
不同转录因子的表达将对转化的神经元亚型产生显着影响,如果大家在重新分析上面的公共数据集的时候发现,各个单细胞亚群各自高表达量基因如果并不能很好的进行生物学描述,不妨对这些数据集做一下转录因子分析,看看能不能挖掘出特征非常明显但是还没有被报道的基因。
这两个月单细胞市场上最劲爆的消息应该就是我们《生信技能树》和《单细胞天地》等公众号都推出来的 10X单细胞转录组钜惠套餐,详见:2个分组的单细胞项目标准分析,原价15~20万的6个10x单细胞转录组套餐,现价10万。
这个活动过于火爆,添加微信咨询的人太多了,三个团队连轴转到现在都还没有处理完毕。主要是因为我们团队为每个前来咨询的小伙伴 都会提供个性化点评,避免大家花10万块钱的冤枉钱,做了测序却不知道如何分析如何写作。而且绝大部分小伙伴提出来的测序样品,其实早就在这两三年单细胞火爆的时候有文献发表了,如果不是自己的样品有特殊的临床意义,我们其实非常的不建议大家自己花费10万块钱做自己的6个单细胞转录组样品。
如果我给你指出来了你所需要的公开的数据,但是你却不知道如何利用它,我想你自己的花10万块钱测序拿到了自己的数据,未必就能更好的分析。比如 我这次介绍的4个文献,你读一下,下载数据,扪心自问,能做到文章作者这样的分析吗。