前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【生信文献200篇】17 单细胞转录组揭示韩国人乳腺癌病人异质性

【生信文献200篇】17 单细胞转录组揭示韩国人乳腺癌病人异质性

作者头像
生信菜鸟团
发布2021-03-04 14:46:24
7910
发布2021-03-04 14:46:24
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

0 文章信息

英文标题:Single-cell analyses of transcriptional heterogeneity in squamous cell carcinoma of urinary bladder

中文标题:单细胞RNA-seq对原发性乳腺癌综合分析和免疫细胞分析

期刊:《Nat Commun》

影响因子:12.124 发表时间:2017-05-05

研究领域:单细胞转录分析 乳腺癌

DOI号:10.18632/oncotarget.11803

1 总述

作者通过单细胞RNA-seq分析了11个患者的515个乳腺癌细胞,并根据拷贝数变异(CNV)对细胞进行分类。最后,研究揭示了微环境中肿瘤细胞和免疫细胞形成的不同肿瘤亚型的特征。并且其微环境由肿瘤细胞和免疫细胞(T淋巴细胞,B淋巴细胞和巨噬细胞)组成。

2 背景

单细胞转录组在癌症研究领域应用价值很大,包括:

• Non-invasive monitoring of circulating tumour cells

• estimation of tumour heterogeneity

• early detection of small numbers of recurrent tumours

• sensitive monitoring of rare cell populations

肿瘤微环境

1. 微环境的基因表达特征本身可以呈现独立于固有的肿瘤亚型的预后值;

2. 形成癌症微环境的主要细胞群包括与癌症相关的成纤维细胞和免疫细胞。

3. 具有调节性或衰竭表型的T细胞与抗肿瘤免疫的失败有关。

4. 部分文章表明B细胞通过影响包括T细胞和TAM在内的多种细胞类型来促进肿瘤,但肿瘤区域大量B细胞的存在与良好的预后有关。

3 主要流程

单细胞转录组数据

用的是microfluidic chips捕获单细胞,建库是SMARTer Ultra Low RNA Kit 去除低质量细胞:

  • (1) number of total reads;
  • (2) mapping rate;
  • (3) number of detected genes;
  • (4) portion of intergenic region.

去除低质量基因

  • First, TPM values < 1 were considered unreliable and substituted with zero.
  • Second, TPM values were log2-transformed after adding a value of one.
  • Third, genes expressed in < 10% of all tumour groups were removed.

最后剩下 515单细胞和17,779基因!

单细胞转录组数据在 :GSE75688 可以下载,里面也包括了bulk的转录组数据。

Bulk tumor transcriptomes showed significant correlations with the average of single cell transcriptomes.

外显子数据

外显子测序用的是 SureSelect XT Human All Exon V5 kit,illumina测序仪的PE100,走的是标准肿瘤外显子流程,找somatic mutation用的是mutect软件,CNV分析用的是Control-FREEC ,肿瘤约100X,正常对照组织约50X。

外显子数据在 SRP067248 可以下载,共24个测序文件。

肿瘤外显子数据分析结果都放在附件,应该是作者认为不是本文的亮点,就是有哪些突变信息描述一下,然后提到一下TNBC的拷贝数变化剧烈这个现象。

功能分析

检查了包括:

  • epithelial–mesenchymal transition (EMT)
  • stemness
  • angiogenesis
  • proliferation
  • recurrence

这些重要的功能通路。

计算一下signature scores

这里使用的是 ESTIMATE 算法:

  • Tumour score
  • Stromal score
  • immune signature

这些计算都是为了说明同一个病人体内取到的单细胞的确应该分类,而且不同的类别差别很大,如下图:

两个重要的R包:

  • GSVA software in the R package
  • Molecular subtypes of tumours were predicted using the R package genefu.
    • ER module score
    • HER2 module score

4 结果

4.1 Genomic profiles of 11 patients for single-cell analysis

只有11个病人的数据,但是涵盖了4种乳腺癌的分类;

  • ER-positive (BC01 and BC02; luminal A)
  • ER/HER2-positive (BC03; luminal B)
  • HER2-positive (BC04, BC05 and BC06; HER2)
  • triple- negative (BC07–BC11; TNBC) invasive ductal carcinoma

作者通过全外显子测序分析了样品体细胞突变和拷贝数变异的基因组情况。

作者通过插入RNA的比值保证了所有单细胞RNA测序的一致性。并选择24个基因进行qPCR支持单细胞RNA-seq的数据。

4.2 Separation of tumour and tumour-associated normal cells

作者通过基因表达谱发现了肿瘤内异质性。

由于作者提取的单细胞并没有进行FACS筛选,所以包括以下;

  • 癌症细胞
  • 非癌细胞
    • fibroblasts
    • adipocytes
    • endothelial cells
    • diverse immune cells

肿瘤组织的基因表达谱反映了肿瘤和周围微环境的特征。作者通过CNV将乳腺癌细胞分类:

采取了GTex数据库的breast组织的表达信息做过滤。183 mammary tissue data from GTEx portal (http://www.gtexportal.org/). 如下图:

转录组的无监督主成分分析结果证实了癌细胞与非癌细胞的分离。

使用ESTIMATE算法得出肿瘤纯度值。大多数非癌细胞都在免疫特征方面得分很高,低分的非癌细胞可能是成纤维细胞。

最后,作者在515个单细胞中捕获了317个上皮乳腺癌细胞,175个与肿瘤相关的免疫细胞和23个非癌基质细胞。

4.3 Intrinsic tumour cell heterogeneity in cancer aggressiveness

515个细胞的基因表达的细胞间相关性分析表明,来自同一患者的细胞之间的相似度相对较低:

区分成功了肿瘤细胞与否,就能对每个病人的不同细胞类型进行比较,比如分组计算表达相关系数,结果如下;

同一个病人的肿瘤细胞及其非肿瘤细胞的区别变化范围很大,说明了其异质性。

很明显,对恶性细胞来做主成分分析后聚类发现每个病人都聚成自己独立的类,而对非肿瘤细胞来说,会根据细胞类型来聚类,不同的个体这样的影响因素很小,如下图:

使用ER和HER2模块分数,将肿瘤细胞亚型预测为ER+,HER2+或TNBC类型,表明了HER2肿瘤的瘤内亚型异质性。

侵袭性肿瘤基因表达特征(EMT、stemness和血管生成)之间的皮尔逊相关系数(r):

发现HER2和TNBC肿瘤细胞均表达高水平的stemness和复发特征。EMT、stemness和血管生成特征显著正相关。

4.4 Heterogeneity components in breast cancer subtypes

利用单细胞数据集,确定了乳腺癌亚型之间的差异表达基因。

图5b表示基因集变异分析显示,PI3K、NF-kB、MEK通路基因在BC04细胞中的表达高于其他细胞。

图5c表示:TNBC肿瘤甚至可以进一步分为6个不同的亚组,显示出广泛的瘤内异质性。

4.5 Heterogeneity in tumour-infiltrating immune cells

作者通过与细胞类型特异性免疫基因组非负因子分解聚类将免疫细胞分为了3组:①B细胞;②T细胞;③Mφ细胞。

确定了B淋巴细胞的两个亚型:①具有成纤维细胞/中心细胞的表达特征;②具有初级B淋巴细胞的表达特征。

作者通过免疫染色证明了肿瘤浸润性T细胞和B细胞:

作者对浸润肿瘤的T细胞进行了活化和功能状态的分析。使用GSVA富集评分对原始T细胞、T细胞共刺激、调节细胞因子和受体、T细胞耗竭和细胞毒性(上图)的基因集进行分级聚类。

综上:乳腺癌样品中的先天和适应性免疫细胞群体均显示出免疫抑制基因表达特征。

5 延伸

5.1 GSVA

GSVAGSEA的差别在于,这种方法不需要对基因进行排序,因此也意味着不需要首先进行其他的统计学分析,如基因在样本之间的表达差异,如变化倍数,然后根据变化值从高到低进行排序。只需要样本内基因的排序,每个样本内部可以根据基因表达的count值来进行排序,从而在样本内部是否有基因富集。针对每个样本进行分析。

输入数据:①表达矩阵:SYMBOL号;②分组信息;③基因集(gene_list)

  • 结果解读:

GSVA对数据库中的每一个通路在每个样本中算了一个值,相当于GSEA的enrichment score, 如果得分越高,说明这个通路在该样本中被改变的越严重。 得到的GSVA得分矩阵可以用来做差异分析,看哪些通路在两个分组中存在差异,类似于基因表达差异分析。

来源:【生信技能树-三阴性乳腺癌表达数据探索笔记之GSVA分析】

5.2 R包genefu

genefu包简介:乳腺癌中基于基因表达的特征的计算。

genefu包自带了5个乳腺癌芯片数据集,可以直接根据已知基因集对乳腺癌进行分子分型。

https://bioconductor.org/packages/release/bioc/html/genefu.html 【生信技能树-使用R包genefu来根据基因集进行表达谱分类】

5.3 ESTIMATE 算法

全称:Estimation of STromal and Immune cells in MAlignant Tumour tissues using Expression data,利用表达数据估计恶性肿瘤组织中的基质细胞和免疫细胞

ESTIMATE是基于ssGSEA算法,对 stromal and immune 两个基因集在表达矩阵的各个样本进行打分。

其研究重点为:基质细胞和免疫细胞。两者含量越多,肿瘤纯度越低。

其输出结果包括:

  • stromal scor:基质细胞评分;
  • immune score:免疫细胞评分
  • estimate score:综合评分(基质细胞打分和免疫细胞打分的加和)
  • TumorPurity:肿瘤纯度

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 0 文章信息
  • 1 总述
  • 2 背景
  • 3 主要流程
    • 单细胞转录组数据
      • 外显子数据
        • 功能分析
          • 计算一下signature scores
            • 两个重要的R包:
            • 4 结果
              • 4.1 Genomic profiles of 11 patients for single-cell analysis
                • 4.2 Separation of tumour and tumour-associated normal cells
                  • 4.3 Intrinsic tumour cell heterogeneity in cancer aggressiveness
                    • 4.4 Heterogeneity components in breast cancer subtypes
                      • 4.5 Heterogeneity in tumour-infiltrating immune cells
                      • 5 延伸
                        • 5.1 GSVA
                          • 5.2 R包genefu
                            • 5.3 ESTIMATE 算法
                            领券
                            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档