英文标题:Single-cell analyses of transcriptional heterogeneity in squamous cell carcinoma of urinary bladder
中文标题:单细胞RNA-seq对原发性乳腺癌综合分析和免疫细胞分析
期刊:《Nat Commun》
影响因子:12.124 发表时间:2017-05-05
研究领域:单细胞转录分析 乳腺癌
DOI号:10.18632/oncotarget.11803
作者通过单细胞RNA-seq分析了11个患者的515个乳腺癌细胞,并根据拷贝数变异(CNV)对细胞进行分类。最后,研究揭示了微环境中肿瘤细胞和免疫细胞形成的不同肿瘤亚型的特征。并且其微环境由肿瘤细胞和免疫细胞(T淋巴细胞,B淋巴细胞和巨噬细胞)组成。
单细胞转录组在癌症研究领域应用价值很大,包括:
• Non-invasive monitoring of circulating tumour cells
• estimation of tumour heterogeneity
• early detection of small numbers of recurrent tumours
• sensitive monitoring of rare cell populations
肿瘤微环境
1. 微环境的基因表达特征本身可以呈现独立于固有的肿瘤亚型的预后值;
2. 形成癌症微环境的主要细胞群包括与癌症相关的成纤维细胞和免疫细胞。
3. 具有调节性或衰竭表型的T细胞与抗肿瘤免疫的失败有关。
4. 部分文章表明B细胞通过影响包括T细胞和TAM在内的多种细胞类型来促进肿瘤,但肿瘤区域大量B细胞的存在与良好的预后有关。
用的是microfluidic chips捕获单细胞,建库是SMARTer Ultra Low RNA Kit 去除低质量细胞:
去除低质量基因
最后剩下 515单细胞和17,779基因!
单细胞转录组数据在 :GSE75688 可以下载,里面也包括了bulk的转录组数据。
Bulk tumor transcriptomes showed significant correlations with the average of single cell transcriptomes.
外显子测序用的是 SureSelect XT Human All Exon V5 kit,illumina测序仪的PE100,走的是标准肿瘤外显子流程,找somatic mutation用的是mutect软件,CNV分析用的是Control-FREEC ,肿瘤约100X,正常对照组织约50X。
外显子数据在 SRP067248 可以下载,共24个测序文件。
肿瘤外显子数据分析结果都放在附件,应该是作者认为不是本文的亮点,就是有哪些突变信息描述一下,然后提到一下TNBC的拷贝数变化剧烈这个现象。
检查了包括:
这些重要的功能通路。
这里使用的是 ESTIMATE 算法:
这些计算都是为了说明同一个病人体内取到的单细胞的确应该分类,而且不同的类别差别很大,如下图:
只有11个病人的数据,但是涵盖了4种乳腺癌的分类;
作者通过全外显子测序分析了样品体细胞突变和拷贝数变异的基因组情况。
作者通过插入RNA的比值保证了所有单细胞RNA测序的一致性。并选择24个基因进行qPCR支持单细胞RNA-seq的数据。
作者通过基因表达谱发现了肿瘤内异质性。
由于作者提取的单细胞并没有进行FACS筛选,所以包括以下;
肿瘤组织的基因表达谱反映了肿瘤和周围微环境的特征。作者通过CNV将乳腺癌细胞分类:
采取了GTex数据库的breast组织的表达信息做过滤。183 mammary tissue data from GTEx portal (http://www.gtexportal.org/). 如下图:
转录组的无监督主成分分析结果证实了癌细胞与非癌细胞的分离。
使用ESTIMATE算法得出肿瘤纯度值。大多数非癌细胞都在免疫特征方面得分很高,低分的非癌细胞可能是成纤维细胞。
最后,作者在515个单细胞中捕获了317个上皮乳腺癌细胞,175个与肿瘤相关的免疫细胞和23个非癌基质细胞。
515个细胞的基因表达的细胞间相关性分析表明,来自同一患者的细胞之间的相似度相对较低:
区分成功了肿瘤细胞与否,就能对每个病人的不同细胞类型进行比较,比如分组计算表达相关系数,结果如下;
同一个病人的肿瘤细胞及其非肿瘤细胞的区别变化范围很大,说明了其异质性。
很明显,对恶性细胞来做主成分分析后聚类发现每个病人都聚成自己独立的类,而对非肿瘤细胞来说,会根据细胞类型来聚类,不同的个体这样的影响因素很小,如下图:
使用ER和HER2模块分数,将肿瘤细胞亚型预测为ER+,HER2+或TNBC类型,表明了HER2肿瘤的瘤内亚型异质性。
侵袭性肿瘤基因表达特征(EMT、stemness和血管生成)之间的皮尔逊相关系数(r):
发现HER2和TNBC肿瘤细胞均表达高水平的stemness和复发特征。EMT、stemness和血管生成特征显著正相关。
利用单细胞数据集,确定了乳腺癌亚型之间的差异表达基因。
图5b表示基因集变异分析显示,PI3K、NF-kB、MEK通路基因在BC04细胞中的表达高于其他细胞。
图5c表示:TNBC肿瘤甚至可以进一步分为6个不同的亚组,显示出广泛的瘤内异质性。
作者通过与细胞类型特异性免疫基因组非负因子分解聚类将免疫细胞分为了3组:①B细胞;②T细胞;③Mφ细胞。
确定了B淋巴细胞的两个亚型:①具有成纤维细胞/中心细胞的表达特征;②具有初级B淋巴细胞的表达特征。
作者通过免疫染色证明了肿瘤浸润性T细胞和B细胞:
作者对浸润肿瘤的T细胞进行了活化和功能状态的分析。使用GSVA富集评分对原始T细胞、T细胞共刺激、调节细胞因子和受体、T细胞耗竭和细胞毒性(上图)的基因集进行分级聚类。
综上:乳腺癌样品中的先天和适应性免疫细胞群体均显示出免疫抑制基因表达特征。
GSVA与GSEA的差别在于,这种方法不需要对基因进行排序,因此也意味着不需要首先进行其他的统计学分析,如基因在样本之间的表达差异,如变化倍数,然后根据变化值从高到低进行排序。只需要样本内基因的排序,每个样本内部可以根据基因表达的count值来进行排序,从而在样本内部是否有基因富集。针对每个样本进行分析。
输入数据:①表达矩阵:SYMBOL号;②分组信息;③基因集(gene_list)
GSVA对数据库中的每一个通路在每个样本中算了一个值,相当于GSEA的enrichment score, 如果得分越高,说明这个通路在该样本中被改变的越严重。 得到的GSVA得分矩阵可以用来做差异分析,看哪些通路在两个分组中存在差异,类似于基因表达差异分析。
genefu包简介:乳腺癌中基于基因表达的特征的计算。
genefu包自带了5个乳腺癌芯片数据集,可以直接根据已知基因集对乳腺癌进行分子分型。
https://bioconductor.org/packages/release/bioc/html/genefu.html 【生信技能树-使用R包genefu来根据基因集进行表达谱分类】
全称:Estimation of STromal and Immune cells in MAlignant Tumour tissues using Expression data,利用表达数据估计恶性肿瘤组织中的基质细胞和免疫细胞
ESTIMATE是基于ssGSEA算法,对 stromal and immune 两个基因集在表达矩阵的各个样本进行打分。
其研究重点为:基质细胞和免疫细胞。两者含量越多,肿瘤纯度越低。
其输出结果包括: