前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Science | The Tabula Sapiens:人类的多器官、单细胞转录组图谱

Science | The Tabula Sapiens:人类的多器官、单细胞转录组图谱

作者头像
DrugAI
发布2023-09-19 14:14:21
3260
发布2023-09-19 14:14:21
举报
文章被收录于专栏:DrugAI

报道人 | 于洲

今天我们介绍由Tabula Sapiens联盟发表在Science上的工作,该工作创建了一个人类参考图谱,包括来自24种不同组织和器官的近50万个细胞。该图谱使得400多种细胞类型的分子特征、它们在组织中的分布以及基因表达的组织特异性变异成为可能。

背景介绍

虽然基因组常被称为生物体的蓝图,但也许更准确的说法是将其描述为由各种基因组成的零件表,这些基因可能用于或不用于多细胞生物体的不同细胞类型。虽然人体中几乎每个细胞基本上都有相同的基因组,但每种细胞类型对基因组的使用不同,并表达所有可能基因的子集。因此,基因组本身并不能提供对该生物体各种细胞类型的分子复杂性的理解。这促使人们努力通过转录和蛋白质组学方法来表征人类和多种模式生物中各种细胞类型的分子组成。尽管这些努力正在产生一些见解,但当前方法采集单个器官通常在不同地点或来自不同的供体,使用不同的处理方案以及缺乏重复数据。当供体在遗传背景、年龄、环境暴露和表观遗传影响方面存在差异时,对不同组织和器官之间的细胞类型进行控制比较尤其困难。为了解决这个问题,本文开发了一种方法来分析来自同一个体的大量器官,并且最初使用这种方法来表征小鼠各种细胞类型中基因表达的年龄相关变化。

本文的创新与贡献:

  • 提供了一个全面的、高分辨率的人类细胞转录组图谱,涵盖了24个不同的组织和器官中的400多种细胞类型。
  • 不仅提供了对人类基因表达的分布和变异的深入理解,还为未来的研究提供了一个重要的参考基准。
  • 开发了一种新的方法来处理和分析单细胞转录组数据,这种方法可以更准确地识别和分类细胞类型,并提高数据的可重复性和可比性。

实验介绍与结果

数据收集和单元格类型表示

如图1所示,本文从个体人类供体(指定TSP1至TSP15)收集了多个组织,并对活细胞进行了协调的单细胞转录组分析。本文从一个捐赠者收集了17个组织,从第二个捐赠者收集了14个组织,从另外两个捐赠者收集了5个组织。本文还从另外11个捐赠者收集了少量组织,为几乎所有组织创建了生物复制。捐赠者来自不同种族,性别均衡,平均年龄为51岁,具有不同的医学背景。

图1:Tabula Sapiens概述

单细胞转录组测序采用荧光活化细胞分选(FACS)分选的细胞在孔板上进行smart-seq2扩增,并对每个组织进行10倍微流体液滴捕获和扩增。细胞组织专家使用一个定义的细胞本体术语,在不同组织中一致地注释细胞类型,从而得到总共475种具有参考转录组谱的不同细胞类型。本文收集了膀胱、血液、骨髓、眼睛、脂肪、心脏、肾脏、大肠、肝脏、肺、淋巴结、乳腺、肌肉、胰腺、前列腺、唾液腺、皮肤、小肠、脾脏、胸腺、舌头、气管、子宫和脉管系统的数据,一共收集、处理和分析59个独立标本,其中483,152个细胞通过了质量控制(QC)过滤。在每个细胞室的基础上,数据集包括264,824个免疫细胞,104,148个上皮细胞,31,691个内皮细胞和82,478个基质细胞。研究活细胞而不是分离细胞核,确保数据集包括细胞内所有mRNA转录本,包括细胞剪接机制处理过的转录本,从而能够深入了解可选剪接的变化。

为了描述转录组数据与常规组织学分析之间的关系,一组病理学家分析了来自供体TSP2的9个组织和来自供体TSP14的13个组织的苏木素与伊红(H&E)染色切片。细胞通过形态学鉴定,大致分为上皮细胞、内皮细胞、免疫细胞和间质细胞以及很少检测到的外周神经系统(PNS)细胞类型(图2A)。

图2A:用于TSP2结肠组织学的H&E染色图像,由病理学家识别的区室(实色线)和单个细胞类型(黑色虚线)

这些分类用于估计四个隔室中细胞类型的相对丰度,并估计由每种组织类型的空间异质性引起的这些丰度的不确定性(图2B)。本文将组织学测定的丰度与单细胞测序获得的丰度进行了比较,在大范围的组织和相对丰度中观察到广泛的一致性。

图2B:病理学家在几个组织中从形态学上按组织的异质性增加的排序估计了TSP2的粗细胞类型代表。

免疫细胞:跨组织基因表达的变异和共同的谱系历史

Tabula Sapiens可以用来研究基因表达程序的差异和跨组织共享的细胞类型的谱系历史。本文分析了分布在20个组织中的36,475个巨噬细胞的组织差异,因为已知组织驻留巨噬细胞具有特殊功能。例如,脾脏中的巨噬细胞与大多数其他巨噬细胞不同,这在很大程度上是由CD5L的高表达驱动的,其中CD5L是一种脂质合成调节剂。与循环组织相比,本文还观察到在皮肤、子宫和乳腺等实体组织中表调节蛋白(EREG)表达升高的共同特征。本文通过组装来自供体TSP2的T细胞受体序列来表征T细胞之间的谱系关系,如图3A所示,绘制了分布在身体的不同部位的多个T细胞谱系之间的关系。

图3A:T细胞在多个组织中的克隆分布示意图。

大型克隆通常存在于多个器官中,粘膜相关不变T细胞的几个克隆在供体中是共享的;这些细胞具有TRAV1-2的特征性表达,因为它们被认为是先天样效应细胞。细胞系年龄信息也可以揭示B细胞中组织特异性体细胞高突变率。本文组装了来自供体TSP2的B细胞受体序列,并推断了每个细胞的种系差异。实体组织中每个核苷酸的突变多一个数量级,说明实体组织的免疫浸润以成熟B细胞为主。B细胞也经历类别转换重组,通过使用在免疫中具有不同作用的恒定区基因来使体液免疫反应多样化。

如图3B所示,本文将数据集中的每个B细胞分类为免疫球蛋白A(IgA)、IgG或IgM表达,然后计算每个组织中每种细胞同型的相对数量。已知分泌性IgA与粘膜上的途径原和共生体相互作用,IgG通常参与途径原的直接中和,IgM通常在naïve B细胞中表达或在对病原体的第一反应中分泌。与此一致的是,本文的分析揭示了IgA和IgM表达的B细胞在这些区域的流行梯度相反,血液中产生IgA的细胞相对丰度最低,而大肠中产生IgA的细胞相对丰度最高(表达IgM的B细胞的相对丰度相反)。

图3B:组织中B细胞同种型按IgA丰度的递减顺序排列的流行程度。

内皮细胞亚型与组织特异性基因表达程序

作为分析跨器官共享细胞类型的另一个例子,本文关注的是内皮细胞(ECs)。尽管内皮细胞通常被归类为单一细胞类型,但它们在形态、结构、免疫调节和代谢表型上表现出差异,这取决于它们的起源组织。本文发现,组织特异性也反映在它们的转录组中,因为ECs主要根据起源组织聚集。均匀流形近似和投影(UMAP)分析显示,肺、心脏、子宫、肝脏、胰腺、脂肪和肌肉的ECs表现出最明显的转录特征,反映了它们高度专业化的作用。值得注意的是,来自胸腺、脉管系统、前列腺和眼睛的ECs相似地分布在几个簇中,这不仅表明转录谱相似,而且表明它们的异质性来源相似。来自这16个组织的内皮细胞之间的差异基因表达分析揭示了几个典型的和以前未描述的组织特异性血管标志物(图3C)。

图3C:整个数据集中组织特异性内皮标志物的表达水平。许多标记是高度组织特异性的,通常来自多个捐赠者,如下:膀胱(3个)、眼睛(2个)、脂肪(2个)、心脏(1个)、肝脏(2个)、肺(3个)、乳腺(1个)、肌肉(4个)、胰腺(2个)、前列腺(2个)、唾液腺(2个)、皮肤(2个)、胸腺(2个)、舌头(2个)、子宫(1个)和脉管系统(2个)。

这些数据概括了组织特异性血管标志物,如眼睛中的LCN1,前列腺中的ABCG2和肝脏中的OIT3。在该分析确定的潜在未描述的标记中,SLC14A1似乎是心脏内皮细胞的特异性标记,其表达通过了来自人类蛋白质图谱的数据独立验证。肺内皮细胞形成了两个不同的群体,这与小鼠和人肺中描述的星细胞(aCap - EDNRB+)和一般毛细血管细胞(gCap - PLVAP+)一致。gCaps的转录谱也更类似于来自其他组织的内皮细胞,表明具有一般血管功能的gCaps群体与更专门化的aCaps群体相异。最后,本文在肌肉中检测到两个不同的ECs群体,包括具有强血管生成和内皮细胞增殖特征的MSX1+群体和富含代谢基因的CYP1B1+群体,这表明肌肉血管系统中存在功能特化。

可选择的剪接变体是细胞类型特异性的

本文通过SICILIAN使用10x和smart-seq2测序技术鉴定了Tabula Sapiens的备选剪接连接,共发现了955,785个连接。其中,217,855个是先前注释过的,因此本文的数据提供了整个RefSeq数据库中编录的61%的连接的依赖验证。虽然注释的连接只占总连接的22.8%,但它们占总读取量的93%,这表明先前注释的连接往往比先前未识别的连接表达水平更高。本文还发现了34,624个连接在先前未标记的3 '和5 '剪接位点之间(3.6%),并且在基因中先前注释的位点和先前未注释的位点之间发现了119,276个连接(12.4%)。这就留下了584,030个假定的连接,它们的两个剪接位点以前都没有被注释过,约占总检测结果的61%。其中大多数至少有一端位于已知基因中(94.7%),而其余的则代表未注释区域的潜在先前未描述的剪接变体(5.3%)。在缺乏独立验证的情况下,本文保守地将所有未注释的剪接描述为假定的先前未知的连接。随后使用GTEx数据库寻找这些假设连接的独立确凿证据,发现在GTEx数据中可以找到与这些先前未知连接相关的近三分之一的读取或响应,这相当于由Tabula Sapiens揭示的300,000个先前未定义的验证剪接变体。

本文关注两个细胞类型特异性剪接的例子,这两个研究得很好的基因分别为MYL6和CD47。MYL6是肌球蛋白的重要轻链(ELC),在所有组织和区室中高度表达。然而,MYL6的剪接,特别是包括或排除外显子6的剪接(图4A),以细胞类型和室特异性的方式变化(图4B)。尽管不包括外显子6的异构体先前主要在相平滑肌中被描述,但本文发现它也可能是非平滑肌细胞类型的主要异构体。本文的分析表明,MYL6剪接在许多细胞类型中普遍存在调控,如内皮细胞和免疫细胞。来自Tabula Sapiens数据集的多个个体再现了这些以前未知的、室特异性的两种MYL6亚型表达模式。

而CD47是一种多跨膜蛋白,参与许多细胞过程,包括血管生成和细胞迁移,并作为巨噬细胞的“不要吃我”信号。外显子7至10的不同使用(图4C)构成了一个可变长的细胞质尾。免疫细胞、基质细胞与内皮细胞在CD47中有一个独特的、一致的剪接模式,主要表现为排除两个近端外显子,直接剪接到外显子8。与其他区室相比,上皮细胞表现出不同的剪接模式,通过更常见地剪接外显子9和外显子10来增加细胞质尾部的长度(图4D)。单细胞中CD47剪接程序的表征可能对理解CD47的差异信号活动和对CD47功能的治疗性操作具有重要意义。

图4:备选剪接分析。A, B:MYL6的第6外显子在不同的区室中以不同的比例被跳过。免疫区室和上皮区室的细胞倾向于跳过外显子,而内皮和基质区室的细胞倾向于包括外显子。计算每个大于10个读取映射到外显子跳跃事件的细胞包含外显子6的连接读取的比例。C, D:CD47的选择性剪接涉及一个5 '剪接位点(外显子11;108,047,292)和4个3 '剪接位点。

细胞状态动态可以从单个时间点推断出来

尽管Tabula Sapiens是根据每个捐赠者的单一时刻创建的,但可以从数据中推断出动态信息。细胞分裂是细胞内部状态的一个重要的瞬时变化,本文计算了每种细胞类型的循环指数,以识别活跃增殖与静止或有丝分裂后的细胞状态。快速分裂的祖细胞具有最高的循环指数,而内皮细胞和间质细胞的循环指数较低,这些细胞大部分是静止的(图5A)。

图5:细胞状态的动态变化。A:按每个供体的细胞循环指数大小排序的细胞类型(每个单独的颜色),最高度增殖的细胞在顶部,静止的细胞在底部;B:RNA速度分析显示膀胱内间充质细胞向肌成纤维细胞转变;C, D:膀胱间充质细胞向肌成纤维细胞转化的潜伏期分析,显示了基因表达轨迹的刻板变化。

肠组织中,瞬时扩增细胞和隐窝干细胞在肠隐窝中迅速分裂,产生绒毛的终分化细胞类型。这些细胞的循环指数最高,而最终分化的细胞类型(如杯状细胞)的循环指数最低。为了补充细胞周期的计算分析,本文对肠道组织进行了MKI67蛋白(通常称为Ki-67)的免疫染色,并证实了瞬时扩增的细胞大量表达该增殖标志物,这支持了该标志物在G2/M集群中差异表达的结论。本文观察到细胞周期中几个有趣的组织特异性差异。比如,巨噬细胞的UMAP聚类显示了这种细胞类型的组织特异性聚类,与膀胱、皮肤和肌肉中的巨噬细胞相比,血液、骨髓和肺巨噬细胞具有最高的循环指数。与这一发现一致,细胞周期蛋白依赖性激酶(CDK)抑制剂(特别是CDKN1A基因)在高循环指数组织的巨噬细胞中总体表达最低。

本文使用RNA速度作为进一步的动态方法来研究膀胱间充质细胞向肌成纤维细胞的转分化(图5B)。潜伏时间分析利用RNA速度轨迹提供了每个细胞内部时钟的估计,正确地识别了多个供体的分化方向(图5C)。以潜伏时间为函数对细胞进行排序,显示了最动态表达基因的间充质和肌成纤维细胞基因表达程序的聚类(图5D)。

微生物组中意想不到的空间变化

Tabula Sapiens提供了一个密集和直接采样整个胃肠道的人类微生物组的机会。供体TSP2和TSP14的肠道被切片成五个区域:十二指肠、空肠、回肠、升结肠和乙状结肠(图6A)。每个切片横切,每个位置采集3 ~ 9个样本,进行16S核糖体RNA(rRNA)基因扩增和测序。同样,即使在结肠中,变形菌门,特别是肠杆菌科的相对丰度也很高(10%-30%)(图6B)。来自十二指肠、空肠和回肠的样品在很大程度上彼此不同,显示出某些科中个体部分的表达或缺失。在小肠中,丰富度也是可变的,并且与伯克氏菌科的相对丰度呈负相关。与升结肠和乙状结肠相比,十二指肠、空肠和回肠的相对丰度或丰富度或Shannon多样性更高。

图6:高分辨率视图突出了肠道微生物组的斑块。A:供体TSP2结肠示意图(左)和照片(右),数字1至5代表微生物群采样位置;B:通过16S rRNA测序确定的每个采样地点科水平的相对丰度和丰富度(观察到的物种数量);C:桑基图显示了胃肠道各部分微生物种类的流入和流出;D:T细胞的UMAP聚类揭示了小肠远端和近端不同的转录组谱;E:火山图中的圆点突出了大肠(左)和小肠(右)中上调的基因。

如图6C所示,在整个肠道相邻区域的物种比较中,很大一部分物种是特定于每个区域的,反映了斑块性。本文结合空间微生物组数据分析了宿主免疫细胞,UMAP聚类分析显示来自TSP14的小肠T细胞池包含一个具有不同转录组的群体(图6D)。小肠和大肠T细胞中最显著的转录差异是与转运、存活和激活相关的基因(图6E)。例如,影响T细胞调节功能的长链非编码RNA MALAT1和介导T淋巴细胞发育和向肠道迁移的CCR9的表达仅在小肠中较高,而GPR15、SELENBP1、ANXA1、KLRC2、CD24、GDF15、RARRES2在大肠中的表达更高。肠道中微生物组的位点特异性组成与每个位点不同的T细胞群配对,有助于确定胃肠道中发生的局部宿主-微生物相互作用,并可能反映影响宿主微生物动力学的生理条件梯度。

结论

Tabula Sapiens揭示了与细胞类型之间的共同行为和微妙的器官特异性差异有关的发现。本文发现T细胞克隆在器官之间共享,同时也展示了B细胞在器官依赖性的高突变率。内皮细胞和巨噬细胞在整个血管中共享,通常在基因表达上表现出微妙但明显的差异。本文发现了出乎意料的大量不同数量的细胞类型特异性RNA剪接变体的使用,并发现和验证了许多以前未定义的剪接。肠道微生物组在3英寸(7.62厘米)的长度范围内具有不均匀的物种分布。这证明Tabula Sapiens在细胞分辨率上为深刻理解和探索人类生物学提供了广泛而有用的参考。

参考资料

The Tabula Sapiens Consortium* ,The Tabula Sapiens: A multiple-organ, single-cell transcriptomic atlas of humans.Science376,eabl4896(2022).

DOI:10.1126/science.abl4896

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-20 00:01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档