前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >细胞图谱 | Nature | 单细胞整合揭示炎症性肠病中的化生现象

细胞图谱 | Nature | 单细胞整合揭示炎症性肠病中的化生现象

作者头像
生信菜鸟团
发布2025-01-02 14:44:19
发布2025-01-02 14:44:19
4020
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

Basic Information

  • 英文标题: Single-cell integration reveals metaplasia in inflammatory gut diseases
  • 中文标题:单细胞整合揭示炎症性肠病中的化生现象
  • 发表日期:20 November 2024
  • 文章类型:Article
  • 所属期刊:Nature
  • 文章作者:Amanda J. Oliver | Sarah A. Teichmann
  • 文章链接:https://www.nature.com/articles/s41586-024-07571-1

Abstract

Para_01
  1. 消化道是一个多器官系统,对有效的营养吸收和屏障免疫至关重要。
  2. 基因组学的进步和胃肠道疾病发病率的增加推动了对健康和疾病状态下构成胃肠道组织的细胞进行编目的努力。
  3. 在这里,我们系统地整合了25个单细胞RNA测序数据集,涵盖了整个健康消化道的发育和成年期。
  4. 我们使用新开发的自动化质量控制方法(scAutoQC)统一处理了189名健康对照者的385个样本,生成了一个包含约110万个细胞和136种细粒度细胞状态的健康参考图谱。
  5. 我们将12个胃肠道疾病数据集,包括胃肠道癌症、乳糜泻、溃疡性结肠炎和克罗恩病,锚定到这个参考图谱上。
  6. 利用这个包含160万个细胞的资源(gutcellatlas.org),我们发现了一种起源于干细胞的上皮细胞化生现象,这种现象在转录水平上与幽门腺和布伦纳腺中的细胞相似,出现在肠道炎症性疾病中。
  7. 尽管此前已将其与黏膜修复联系起来,我们现在还发现幽门腺化生细胞通过招募包括T细胞和中性粒细胞在内的免疫细胞参与炎症反应。
  8. 总体而言,我们描述了由炎症引起的干细胞变化,这些变化改变了黏膜组织结构并促进了进一步的炎症,这一概念适用于其他组织和疾病。

Main

Para_01
  1. 人类胃肠道是一个复杂的系统,由多个器官组成,这些器官共同协作吸收营养,同时提供具有免疫活性的屏障。
  2. 胃肠道疾病非常普遍:溃疡性结肠炎和克罗恩病影响了全球超过 700 万人,每年新增约 200 万结直肠癌 (CRC) 病例。
  3. 单细胞转录组学提供了关于胃肠道稳态、发育和疾病的前所未有的分子见解。
  4. 到目前为止,已有超过 25 项关于人类胃肠道的单细胞 RNA 测序 (scRNA-seq) 研究发表,这些研究主要聚焦于特定器官和/或细胞类型。
  5. 这些公开数据集的整合为人类细胞图谱社区及其他领域提供了宝贵的资源,并促进了对胃肠道不同区域细胞类型的跨区域比较。
Para_02
  1. 胃肠道管腔内皮细胞起源于共同的内胚层祖细胞,并在胚胎早期获得其区域身份。
  2. 这种区域身份可以在成年后改变,导致化生,成熟组织被通常发生在其他解剖区域的细胞所替代。
  3. 肠化生在胃和巴雷特食管患者中描述得很清楚,其中黏膜转化为肠上皮细胞,增加了胃和食管腺癌的风险。
  4. 相反,肠组织的幽门化生,包括表达 MUC6 和 MUC5AC 的细胞,研究较少(也称为假幽门化生、胃化生、溃疡相关细胞谱系和松弛多肽表达化生)。
  5. 组织学研究提示,幽门化生可能作为黏膜愈合过程的一部分出现,并可以转变为肿瘤。
  6. 然而,化生细胞在急性及慢性组织损伤中的起源和功能作用仍未解决。
Para_03
  1. 本研究通过整合已发表和新生成的单细胞 RNA 测序 (scRNA-seq) 数据,创建了一个涵盖健康和疾病的胃肠道图谱。
  2. 利用这一资源(gutcellatlas.org),包含来自 271 名供体的 160 万个细胞,我们对炎症性肠病 (IBD) 和乳糜泻患者的肠道炎症中的细胞类型及其特征进行了研究。
  3. 我们在炎症肠道中发现了表达 MUC6 的化生细胞,这些细胞来源于 IBD 和乳糜泻患者,揭示了幽门腺化生细胞的完整转录组,并将其命名为炎症上皮细胞 (INFLAREs)。
  4. 我们提出,上皮干细胞状态的转变改变了从健康到化生谱系的分化途径,进而促进了慢性疾病中的持续性炎症。

Pan-gastrointestinal data integration

Para_01
  1. 我们整理、整合和统一了来自23个已发表和2个未发表的单细胞RNA测序数据集的胃肠道健康细胞(图1a-c,扩展数据图1a,b和补充表1)。
  2. 覆盖的组织包括口腔黏膜、食道、胃、小肠和大肠以及肠系膜淋巴结。
  3. 为了统一处理数据,我们重新映射了原始测序数据,并通过我们新开发的质量控制管道(scAutoQC)处理基因计数,以无偏见和自动化的方式去除低质量细胞(方法;图1b,扩展数据图1和2及补充注释1)。
  4. 我们使用单细胞变分推断(scVI)来整合数据,这种方法优于其他方法(扩展数据图1e)。

Fig. 1: Overview of pan-gastrointestinal cell integration.

  • a,图解概述了图谱,将健康参考作为核心,并通过迁移学习映射了额外的疾病数据集。GI,胃肠道;QC,质量控制。图 a 中的示意图是使用 BioRender(https://biorender.com)创建的。
  • b,scAutoQC 概述,这是一种自动、无监督的质量控制方法,用于去除低质量细胞。UMAP,均匀流形近似和投影。
  • c,每项研究的细胞数和供体数概览,按年龄和胃肠道区域(y 轴)细分。点的大小表示供体数量,颜色表示细胞数量。y 轴的颜色表示广泛级别的器官(口腔黏膜、唾液腺、食道、胃、小肠、大肠和肠系膜淋巴结(MLN))。
Para_02
  1. 最终整合的数据被注释为七个主要谱系(扩展数据图1a),并进一步细分为详细的细胞类型(补充图1-3)。
  2. 由于胃肠道区域和生命阶段存在较大的异质性(扩展数据图3a、b),我们根据年龄和/或区域进一步细分上皮和间充质细胞,以准确注释详细的细胞类型(扩展数据图1a)。
  3. 细胞类型的注释采用半自动化方法,基于已知标记基因的手动注释与基于已发表研究的自动注释相结合(方法)。
  4. 总体而言,我们的健康参考图谱包括来自143名成人或儿科患者以及32名胚胎、胎儿或早产供体的大约110万个细胞,注释为136种详细的细胞类型(扩展数据图1和补充图1-3)。
  5. 我们注释了51种上皮细胞类型或状态,突出了常见和时间或空间受限的群体(补充图2)。
  6. 我们的图谱突显了在不同供体、研究和位置中代表性不同的罕见且难以区分的细胞类型(补充图4和5及补充说明1)。
  7. 我们解析了多样的免疫群体,包括17种T细胞或自然杀伤细胞、16种髓系细胞和11种B细胞和B浆细胞亚群(补充图1)。

Cellular changes in the healthy gastrointestinal tract

Para_01
  1. 比较发育中的胃、十二指肠、回肠和结肠与成熟(儿童和成人)的细胞类型组成,我们观察到发育组织中神经和间质谱系的富集。
  2. 髓系群体,特别是巨噬细胞和 LYVE1+ 巨噬细胞,在发育中的小肠和大肠中也比成年组织更丰富。
  3. 与出生后肠道 IgA 反应的发展一致,大多数 B 细胞亚群在成熟的胃肠道中富集。
  4. 相比之下,前体 B 细胞在发育中的胃肠道组织中富集,这与之前的观察结果一致。
  5. 虽然大多数 T 细胞群体在成熟的胃肠道组织中富集,但 ILC3 和 CD56 高表达的细胞毒性 NK 细胞在发育中的胃肠道组织中富集。
Para_02
  1. 成熟胃肠道区域之间的差异丰度比较显示,口腔黏膜中内皮细胞特异性富集(扩展数据图 3e),这与高水平的血管化一致。
  2. 与其它组织相比,食道中的 IgA2 和 IgM 浆细胞富集(扩展数据图 3f)。
  3. 在间充质群体中,几种区域特异性成纤维细胞在口腔黏膜、食道和直肠中富集(扩展数据图 3g 和补充图 1a)。

Disease-relevant cell dynamics in IBD

Para_01
  1. 我们将溃疡性结肠炎、克罗恩病、儿童 IBD、乳糜泻(未发表)、结直肠癌 (CRC) 和胃癌患者的疾病数据投影到健康参考中(方法;图 2a,b 和补充图 6)。
  2. 总体而言,我们为图谱增加了约 50 万个细胞,使其总计达到 160 万个细胞,涵盖 27 项研究、271 名供体和 6 种胃肠道疾病。
  3. 为了注释疾病相关细胞,我们将疾病数据投影到图谱的亚聚类、谱系特异性和区域特异性视图中(方法;扩展数据图 1b 和补充图 7 和 8)。

Fig. 2: Metaplastic cell lineages in IBD.

  • 联合健康与疾病图谱的 UMAP: 细胞按疾病类别着色,n 表示供体数量。虚线表示广泛的细胞谱系,括号中为细胞数量。
  • 扩展疾病数据的点图: 显示每项研究和疾病中的细胞数量(颜色)和供体数量(点大小)。红色标记的研究(M.E.B.F., 未发表;Kong (2023))作为计数矩阵添加到图谱中。y 轴颜色与图 1c 一致。
  • 间质细胞群: UMAP 和标志基因点图突出显示健康和患病成人或儿童组织中的间质细胞群。“口腔黏膜成纤维细胞”用虚线标出。缩写:DC(树突状细胞),LP(固有层)。
  • 成纤维细胞比例的柱状图: 显示胃肠区域中对照组(n = 4,378 个细胞)和疾病组(n = 2,403 个细胞)的口腔黏膜成纤维细胞或炎症成纤维细胞的比例。
  • 炎症反应基因评分的小提琴图: MSigDB 炎症反应基因评分在疾病类别中的口腔黏膜成纤维细胞或炎症成纤维细胞中进行比较。基因集富集分析显示健康与疾病样本之间存在显著差异。
  • 大肠上皮细胞: UMAP 和标志基因点图突出显示化生的潘氏细胞。柱状图比较对照组与疾病组中结肠细胞和潘氏细胞的比例。缩写:DCS(深隐窝分泌细胞),TA(过渡增殖细胞)。
Para_03
  1. 炎症成纤维细胞群体在IBD和癌症中已被描述,并且预计与健康参考样本的匹配不会完全吻合。
  2. 在我们的图谱中,来自胃、小肠和大肠的IBD和癌症样本中的疾病特异性成纤维细胞意外地映射到了口腔黏膜成纤维细胞。
  3. 因此,疾病特异性成纤维细胞与口腔腔内健康成纤维细胞具有转录相似性,尽管与健康对照相比,它们的炎症基因特征上调(图2c-e,扩展数据图4b-j和补充注释3)。
  4. 在牙周炎中,牙龈黏膜成纤维细胞同样上调了炎症基因,特别是那些参与招募中性粒细胞(CXCL1、CXCL2、CXCL5和CXCL8)以帮助伤口愈合的基因(扩展数据图4k-m)。
  5. 我们假设,在肠道中,这种炎症成纤维细胞状态仅在类似于发炎牙龈黏膜的严重炎症环境中出现。
Para_04
  1. 在上皮细胞区域,我们在大肠中观察到一个特定于疾病的细胞簇,我们根据标记基因DEFA5、DEFA6、REG3A和PLA2G2A将其注释为潘氏细胞(图2f和扩展数据图5a-i)。
  2. 在IBD患者炎症组织及其邻近组织中发现了潘氏细胞,但在健康对照组中未发现,这与慢性结肠炎中的潘氏细胞化生一致(图2f和扩展数据图5g)。
  3. 比较炎症小肠中原生潘氏细胞与炎症结肠中化生潘氏细胞的基因表达谱,我们发现WFDC2和FAM3D的上调(扩展数据图5j)。
  4. 这些基因参与结肠稳态和控制细菌生长,支持潘氏细胞化生在屏障修复中的作用。

Epithelial metaplasia in gut disease

Para_01
  1. 在小肠中,我们观察到两种具有独特特征的上皮细胞群,这些特征在健康和疾病样本之间有所不同。
  2. 在健康的十二指肠中,我们观察到了 MUC6+ 黏液腺颈(MGN)细胞和 MUC5AC+ 表面窝状细胞,这些细胞在形态上类似于 Brunner 腺的细胞(图 3a、b,扩展数据图 6a,补充图 2e 和补充说明 4 和 5)。
  3. 如预期的那样,这些细胞在胃样本中非常丰富,代表了幽门腺的细胞(扩展数据图 6a 和补充图 2d)。
  4. 被注释为 MGN 或表面窝状细胞的疾病细胞在 IBD 患者的回肠中富集(图 3c 和扩展数据图 4a 及 6b、c)。
  5. 在未经治疗的乳糜泻患者的十二指肠中,我们观察到比对照组更多的 MUC6+ 细胞(扩展数据图 6a)。
  6. MGN 样细胞群体的标志基因包括 MUC6、PGC、AQP5 和 BPIFB1(图 3b)。
  7. 在疾病中的表面窝状样细胞群体中,我们观察到 CEACAM7、CEACAM1、DUOX2 和 LCN2 的表达增强且异质性增加(扩展数据图 6b)。
  8. 由于 scRNA-seq 中 MUC5AC 表达较低(扩展数据图 6c-f 和补充说明 5),我们将这种在疾病中特有的细胞群体称为‘表面窝状样’。

Fig. 3: Identification of INFLAREs resembling pyloric or Brunner’s gland neck cells in health.

  • a. 小肠上皮细胞的 UMAP: UMAP 可视化展示了全图谱中(健康和疾病状态)的小肠上皮细胞。与幽门化生相关的 MGN 或 INFLARE 细胞以及表面凹窝细胞用虚线圈出。
  • b. 标志基因点图: 点图突出显示幽门腺细胞标志物(MGN 和表面凹窝细胞)。细胞类型的图例与 a 和 b 共用。
  • c. MGN/INFLARE 的比例: 显示十二指肠和回肠中不同疾病类别的 MGN 或 INFLARE 细胞比例。
  • d. 整体去卷积(BayesPrism): 使用疾病肠上皮作为参考,分析克罗恩病(CD)和溃疡性结肠炎(UC)研究中的样本:
    • E_MTAB_5464: CD (n = 25),UC (n = 27),正常 (n = 27)。
    • GSE111889: CD (n = 122),UC (n = 71),正常 (n = 50)。
    • 使用双边 Wilcoxon 秩和检验计算 P 值。
  • e. LCM 上皮的整体去卷积: 样本包括健康隐窝 (n = 7)、IBD 患者的炎症隐窝 (n = 6)、和 IBD 患者的化生腺体 (n = 6)。箱线图细节:
    • 下边缘:第 25 百分位 (Q1)。
    • 上边缘:第 75 百分位 (Q3)。
    • 中心:中位数。
    • 须状线:Q1 − 1.5 × IQR 和 Q3 + 1.5 × IQR。
    • 离群值:超出须状线范围的值。
  • f. smFISH 染色: 显示克罗恩病患者十二指肠活检样本中 MGN 和 INFLARE 标志基因(MUC6、AQP5、BPIFB1)以及表面凹窝标志物(MUC5AC)的图像,伴有幽门化生。代表性图像 n = 4,比例尺 = 100 μm。
  • g. 腺体中细胞的组织结构: 示意图显示胃腺、小肠上皮、布鲁纳腺和化生幽门腺中的细胞组织。
  • h. MGN 和 INFLARE 细胞分布的示意图: 描绘了 MGN 细胞在健康胃和十二指肠中的分布,以及 INFLARE 细胞在乳糜泻十二指肠、克罗恩病回肠和溃疡性结肠炎结肠中的分布。该示意图使用 BioRender (https://biorender.com) 创建。
Para_03
  1. 据报道,大约28%的IBD患者通过组织学检查发现有幽门化生。
  2. 在我们的图谱中,我们仅在少数患者中发现了INFLAREs,这可能是由于采样偏差所致。
  3. 为了推广我们的研究结果,我们调查了来自儿童和成人IBD患者的黏膜活检的大规模RNA测序数据集。
  4. 使用我们的单细胞数据作为参考进行批量解卷积(方法),我们发现在克罗恩病和溃疡性结肠炎样本以及微解剖化生组织中的INFLAREs比例显著高于健康组织,这与先前报道的患病率一致,并验证了INFLARE标记基因。
  5. INFLAREs在克罗恩病患者的整个肠道中存在,但在溃疡性结肠炎患者中仅存在于大肠,这与炎症的病因和部位相符。
  6. 此外,在乳糜泻患者和微卫星不稳定性CRC患者中也检测到了INFLAREs。
  7. MUC6表达与溃疡性结肠炎中的结肠肿瘤有关,表明INFLAREs可能在结肠炎相关CRC中起直接作用。
Para_04
  1. 为了验证 IBD 和乳糜泻患者中 INFLAREs 的存在,我们在患者样本中进行了免疫组织化学和多重单分子荧光原位杂交(smFISH)(补充表 4)。
  2. 我们在克罗恩病黏膜化生腺体的隐窝基部定位了 INFLAREs(MUC6+AQP5+BPIFB1+),并在隐窝顶部的表面小凹细胞(MUC5AC+)中观察到了这些结构(图 3f–h 和扩展数据图 7g,h)。
  3. 我们注意到基于 AQP5 和 BPIFB1 共表达的 INFLAREs 存在异质性(扩展数据图 7i),并观察到它们与溃疡区域和三级淋巴结构的紧密关联(扩展数据图 7g)。
  4. 我们还在未经治疗的乳糜泻和溃疡性结肠炎患者的病变组织中验证了 INFLAREs(扩展数据图 7j,k)。
  5. 在未经治疗的乳糜泻患者中,MUC6+ INFLARE 化生腺体通过其黏膜定位与健康的 MUC6+ 布鲁纳腺细胞区分开来(扩展数据图 7k,左面板)。
  6. 健康回肠中未发现 MUC6+ 或 MUC5AC+ 细胞(扩展数据图 7l)。
  7. 因此,在慢性炎症期间,INFLAREs 贯穿整个肠道,并且在转录上与局限于胃和十二指肠的健康 MGN 细胞相似(下文将讨论重要差异)(图 3g)。
  8. 据我们所知,这是首次在单细胞分辨率下描述 INFLAREs,即幽门化生的 MUC6+ 细胞。

Origin of INFLAREs

Para_01
  1. 为了探究 INFLAREs 的起源,我们对小肠上皮细胞进行了轨迹分析(方法)(图 4a 和扩展数据图 8a,b)。
  2. INFLAREs 从 LGR5+ 干细胞分支出来(图 4a),并在整个轨迹中保持干细胞基因的表达(图 4b 和扩展数据图 8c)。
  3. 使用单分子荧光原位杂交技术,我们在克罗恩病患者的回肠组织中发现了 INFLAREs 中的 LGR5 和 MKI67 表达(图 4c),验证了其干性和增殖表型。

Fig. 4: INFLAREs originate from stem cells and retain stem-like properties.

  • a,UMAP 图展示了按拟时间轨迹(Monocle3)着色的小肠上皮细胞。这些细胞来自炎症性肠病样本的研究中的回肠。INFLAREs 使用插图突出显示,右侧的 UMAP 图表示细胞类型。
  • b,沿干细胞 → 暂时放大细胞 → INFLARE 轨迹的关键基因表达。误差带对应于对数正态化基因表达的均值 ± 95% 置信区间。
  • c,通过单分子荧光原位杂交(smFISH)检测克罗恩病回肠和十二指肠 INFLAREs(MUC6+)中的增殖(MKI67)和干性(LGR5)基因表达。代表图像来自 n = 4 的样本。
  • d,使用 Genes2Genes 对疾病回肠的干细胞 → 暂时放大细胞 → INFLARE 和健康十二指肠的干细胞 → 暂时放大细胞 → 成熟肠细胞的 Palantir 拟时间轨迹(扩展数据图 8b)进行比对。比对轨迹的细胞密度用 14 个插值时间箱标记,左侧为相应的时间箱的细胞类型比例堆叠条形图。右侧还显示了 1,171 个转录因子沿轨迹的平均对齐路径(白线)。热图矩阵的每个单元格给出了具有匹配拟时间点的转录因子数量。
  • e,小提琴图显示了与成熟肠细胞或 INFLAREs 及干细胞(LGR5+)相关的 cNMF 分析因素中的基因表达情况,涵盖所有小肠细胞。
  • f,因素 5(干细胞因素)和 42(成熟肠细胞和 INFLARE 因素)中基因的排名。显示了参与干细胞功能(蓝色)和成熟肠细胞及 INFLARE 标志物(红色)的基因。
  • g,比较对照组(n = 8)和 IBD(n = 18)回肠伪批量样本中干细胞的差异基因表达分析。基于双侧 Wald 检验并进行 Benjamini-Hochberg 校正,log2 折叠变化为正的基因在 IBD 中相对于健康样本上调。
  • h,我们研究假设的健康小肠(黑色箭头)和炎症性疾病(红色箭头和虚线框)沿隐窝-绒毛轴的上皮细胞轨迹示意图。
Para_02
  1. 为了识别 INFLARE 轨迹的驱动因素,我们对干细胞进行了基因水平的伪时间轨迹对齐,将其与 MGNs 或 INFLAREs(图 4d)或其他炎症谱系(十二指肠的肠细胞和杯状细胞)进行对比(方法;扩展数据图 8b-d)。
  2. 由于转录因子在决定细胞命运中的重要性,我们将分析重点放在转录因子上,并发现了 19 个不匹配的转录因子(可能参与决定 INFLARE 细胞命运)(扩展数据图 8e 和补充注释 7)。
  3. 这些转录因子已被证明与干细胞调节、肠道发育和分泌程序、上皮损伤反应和化生有关(补充注释 5)。
  4. 此外,我们在 NME2 中发现了三个比较中的两个不匹配,NME2 与维持胃癌干细胞特性有关,以及 ATF3、ATF4、CREB3L1 和 CREB3L2,这些编码 cAMP 反应元件结合蛋白,涉及胃和胰腺的损伤反应和化生。
  5. 这些不匹配的转录因子突出了潜在保守的分子机制(炎症应激反应和组织再生程序),这可能是跨组织黏液细胞化生的基础。
Para_03
  1. 将 cNMF 分析应用于小肠中的病变细胞,我们识别出了上皮群体和 INFLAREs 之间共享的转录程序。
  2. 一个干细胞基因程序(图 4e,因子 5)包括排名较高的基因如 SLC12A2、RGMB 和 LGR5(图 4f),在 INFLAREs 中高度表达。
  3. 其他因子区分了 MGN 和 INFLAREs 与其他黏液分泌细胞,例如 INFLARE 特征本身(因子 42)、表面凹陷样特征(因子 15 和 25)以及杯状细胞特征(因子 10;图 4e、f 和扩展数据图 8f),后两者包括预期的细胞类型特异性基因(扩展数据图 8f-h)。
  4. 因此,INFLAREs 是一种具有独特转录特征和干细胞基因表达的独特细胞类型。
Para_04
  1. 比较干细胞基因表达,LEFTY1(胃和食道肠化生前体细胞的标志物)在炎症回肠中比健康回肠更丰富(图4g,扩展数据图8i和补充注释8)。
  2. REG1A、OLFM4和SLC12A2在IBD中也表现出富集(扩展数据图8j),这表明炎症干细胞与健康组织中的干细胞不同,可能解释了它们产生化生细胞的潜力。
  3. 细胞间通讯分析突出了可能有助于形成化生微环境的不同调节干细胞因子。
  4. 特别是,我们确定了配体NGR1、AREG和EREG,这些配体在口腔黏膜/炎症成纤维细胞中上调,并通过EGFR、ERBB2和ERBB3向干细胞和INFLAREs发出信号(扩展数据图8k-m和补充注释9)。
Para_05
  1. 我们的数据共同表明,化生可以由炎症引起的隐窝基干细胞的变化产生,形成 INFLAREs,这是幽门化生的主要谱系(图 4h)。
  2. 此外,INFLAREs 在肠病中保持干细胞特性,代表一个具有可塑性的群体。

Dual role of INFLAREs in disease

Para_01
  1. 先前的研究表明,化生是黏膜组织对损伤和愈合的一种适应性反应。
  2. 支持这一假设的是,INFLAREs 表达 TFF3,这是一种通常由杯状细胞表达的三叶因子,它在黏膜愈合中起关键作用,并且在小鼠中过表达时会导致胃底腺的黏液化生和中性粒细胞浸润。
  3. 相比之下,胃和十二指肠中的健康 MGN 细胞主要表达 TFF2(扩展数据图 9a,b)。
  4. INFLAREs 显著降低了 TFF2 的表达,同时增加了编码一种对抗细菌蛋白的 PLA2G2A 的表达,这种蛋白对干细胞龛非常重要(扩展数据图 9c)。
Para_02
  1. 然而,INFLAREs 还表达了可能促进慢性肠道炎症的程序。
  2. 我们比较了我们的图谱中不同组织、生命阶段和疾病中的 MGN 和 INFLAREs,发现了根据上下文而定的不同特征。
  3. 我们发现,在胃中,病变的 INFLAREs 与健康的 MGN 细胞比在健康的十二指肠中有更大的相似性。
  4. 与健康十二指肠和胃中的 MGN 细胞相比,INFLAREs 上调了细胞因子诱导的炎症程序和 IFNγ 介导的通路基因,这类似于克罗恩病患者回肠干细胞的情况。
Para_03
  1. 为了研究疾病中 INFLAREs 的炎症信号,我们进行了细胞-细胞相互作用分析(方法)。
  2. 与健康 MGN 细胞相比,INFLAREs 过度表达了趋化因子 CXCL16(招募 T 细胞)、CXCL2、CXCL3 和 CXCL5(招募中性粒细胞)以及 CXCL17(髓系招募血管生成因子)。
  3. 健康的胃 MGN 细胞与 INFLAREs 更加相似,与健康的十二指肠 MGN 细胞相比,趋化因子表达上调。
  4. 预测 INFLAREs 上的 CXCL2、CXCL3 和 CXCL5 与静脉内皮细胞上的 ACKR1 相互作用,ACKR1 编码一种非典型受体,可以将趋化因子转运到血管腔内。
  5. 内皮中的 ACKR1 表达与 IBD 中对 TNF 抗体和整合素 α4β7 抗体治疗的耐药性相关,并且可以通过中性粒细胞相互作用上调。
  6. 使用单分子荧光原位杂交技术,我们在克罗恩病组织中发现了 ACKR1+ 血管与 INFLAREs 的紧密关联。
  7. 一致地,在克罗恩病组织的解卷积批量 RNA 测序数据中,静脉内皮细胞与 INFLAREs 相关。
  8. 中性粒细胞标志基因(CXCR1、CXCR2、FCGR3B 和 PROK2)也在批量 RNA 测序数据中与 INFLAREs 相关。
  9. 综上所述,INFLAREs 表达免疫细胞招募趋化因子,这可能加剧肠道疾病的炎症。

Fig. 5: INFLAREs recruit and interact with immune cells in IBD.

  • a,胃、十二指肠和回肠在不同条件下的 MGN 和 INFLAREs 中趋化因子的基因评分。
  • b,由 INFLAREs 表达的 CXCL 趋化因子介导的细胞间相互作用以及各种免疫细胞或静脉内皮细胞(ECs)之间的相互作用。MAIT,黏膜相关不变 T 细胞;TEM,效应记忆 T 细胞;TH17,辅助 T 细胞 17;Treg,调节性 T 细胞;TRM,组织驻留记忆 T 细胞。
  • c,通过 smFISH 染色显示克罗恩病十二指肠中血管与化生腺体接近的 INFLARE(MUC6 和 BPIFB1)、表面凹陷(MUC5AC)和活化的内皮(ACKR1)细胞。n = 3 的代表性图像。比例尺,100 微米。白色箭头突出 ACKR1+ 血管,黄色箭头指示 BPIFB1+MUC6+ 细胞。对于两个图像,比例尺代表 100 微米。
  • d,在不同条件下胃、十二指肠和回肠中的 MGN 和 INFLAREs 中 MHC II 类基因和肽加工基因的基因评分。
  • e,来自克罗恩病切除术的回肠中 INFLAREs(MUC6)、巨噬细胞(CD68)和 MHC II 类(HLA-DR)的蛋白质染色,显示 INFLAREs 中高表达的 MHC II 类。n = 2 的代表性图像。
  • f,从 IFNγR 到 MHC II 类的信号通路图解(左),以及在不同条件下胃、十二指肠和回肠中的 MGN 和 INFLAREs 中该通路的基因评分点图(右)。面板 f 中的图解使用 BioRender (https://biorender.com) 创建。
  • g,克罗恩病回肠中 INFLAREs(MUC6)、CD4 T 细胞(CD3+CD4+)、CD8 T 细胞(CD8+CD3+)和 γδ T 细胞(TCRγδ+CD3+)的蛋白质染色,显示 CD4 T 细胞与 INFLAREs 之间的相互作用。n = 4 的代表性图像。比例尺,100 微米。
  • h,幽门化生在炎症性肠病中的潜在作用图解。INFLAREs 在局部炎症反应中产生,通过分泌黏液和抗菌肽促进黏膜愈合。随着疾病进展,INFLAREs 通过与活化血管的关联、招募各种免疫细胞以及通过 MHC II 类与 CD4+ T 细胞的直接相互作用,促进持续的炎症。
Para_04
  1. 除了炎症细胞因子外,INFLAREs 在与健康 MGN 细胞相比,尤其是十二指肠中的细胞,MHC II 类相关基因表达升高(图 5d,扩展数据图 9c,g-i 和补充注释 8)。
  2. 我们在克罗恩病患者的回肠切片中通过蛋白质水平确认了这一点,显示 INFLAREs 的 HLA-DR 表达远高于周围 MUC6- 腺体和表面上皮(图 5e 和扩展数据图 10a)。
  3. 在发炎组织的其他上皮细胞中也观察到 MHC 水平升高,包括类似表面小凹样细胞和 LGR5+ 干细胞;然而,这种增加在 INFLAREs 中最为显著,与健康 MGN 细胞相比(扩展数据图 9i)。
  4. 我们观察到,与健康组织相比,来自发炎组织的 INFLAREs 中 IFNγ 反应特征增加,这与发炎肠道中 IFNγ 的丰富及其在 MHC II 类调节中的作用一致(图 5f 和扩展数据图 9g,i 和 10b)。
  5. 此外,我们观察到在克罗恩病和乳糜泻组织中,INFLAREs 周围有 CD8+、CD4+ 和 γδ T 细胞,而健康布伦纳腺周围的 T 细胞数量较少(图 5g 和扩展数据图 10c-f)。
  6. 与邻近的 MUC6- 腺体相比,INFLAREs 周围的 CD4 T 细胞密度更高(使用感兴趣区域作为重复单位时显著)(扩展数据图 10e)。
  7. 与升高的 MHC II 类一致,克罗恩病回肠中 CD4+ T 细胞与 INFLAREs 的紧密相互作用表明,INFLAREs 可能在慢性炎症中充当非传统的专业抗原呈递细胞。
  8. 总体而言,除了幽门化生的黏膜愈合假说外,INFLAREs 还可能通过与已知在 IBD 和乳糜泻发病机制中起作用的免疫细胞的相互作用加剧慢性炎症(图 5h)。

Discussion

Para_01
  1. 我们展示了一个覆盖整个人体胃肠道的综合单细胞图谱,以及一套包含生物信息工具(scAutoQC)的工作流程,可协助构建其他大规模图谱。
  2. 通过健康与疾病之间的系统性区域比较,揭示了慢性疾病中具有其他胃肠区域细胞特性的化生谱系,包括潘氏细胞、口腔黏膜/炎症成纤维细胞以及 INFLAREs。
Para_02
  1. MGN 细胞是 INFLAREs 的健康对照,最好描述于健康的胃和十二指肠布伦纳腺中。
  2. 一项关于儿童未接受过治疗的克罗恩病患者的单细胞 RNA 测序研究确定了 MUC6+TFF2+ 和 BPIFB1+AQP5+ 群体,尽管被注释为杯状细胞。
  3. 同样,另一项关于克罗恩病和溃疡性结肠炎的研究将 INFLAREs 识别为 MUC6+PGC+DUOX2+ 肠细胞,在炎症性克罗恩病回肠中富集。
  4. 克罗恩病患者的幽门化生已广泛通过组织学报告,并且我们现在首次以单细胞水平进行注释和探究,具有完整的转录组分辨率。
  5. 我们突出了 INFLAREs 与其健康对照之间的区别特征,并定义了在肠道炎症性疾病中干细胞和成熟分化细胞的变化。
Para_03
  1. 我们的观察支持这样的观点:化生是由于干细胞身份和分化的变化引起的。
  2. 最近对食道和胃的研究提出,化生谱系源自改变的未分化干细胞。
  3. 在IBD患者的回肠中,我们提出了类似的变化,其中肠道损伤促进干细胞分化为INFLAREs。
  4. 我们提供了多个证据线,证明INFLAREs具有干细胞样的特征。
  5. 幽门化生的机制可能部分反映了食道和胃的肠化生机制。
  6. 我们发现INFLAREs表达与肠化生相关的基因和途径,例如LEFTY1和NRG1–ERBB3。
  7. 虽然干细胞向INFLAREs转变的确切机制将是未来研究的重点,但我们强调了潜在机制,包括炎症信号通路、干细胞和组织再生因子以及细胞间通讯途径。
Para_04
  1. 幽门化生可能在损伤后出现以修复黏膜屏障。
  2. 我们的研究结果建立在这些观察之上,提出 INFLAREs 也招募和与免疫细胞相互作用。
  3. 已有描述,在 IBD 患者的肠上皮细胞中 MHC II 类分子表达增加,以及上皮细胞与 CD4+ T 细胞通过 MHC II 类分子的功能性相互作用。
  4. 我们提出,INFLAREs 在炎症条件下同样直接与 CD4+ T 细胞相互作用。
  5. 此外,INFLAREs 可以招募中性粒细胞,类似于炎症成纤维细胞,这可能是通过与 ACKR1+ 血管的紧密关联所辅助的细胞回路实现的。
  6. 支持其促进疾病的作用,许多由 INFLAREs 表达的基因已被纳入 IBD 的全基因组关联研究,包括趋化因子 CXCL1、CXCL2、CXCL3 和 CXCL5 以及 IFNγ 信号通路基因。
Para_05
  1. 总之,我们展示了沿胃肠道的综合单细胞图谱,作为研究健康、发育和疾病中的胃肠道细胞群体的资源。
  2. 利用我们的图谱,我们识别并探究了幽门化生,揭示了化生细胞在肠炎和潜在进展为肿瘤中的起源和作用。

Methods

Patient samples and tissue processing

患者样本和组织处理

Healthy tissue from adults

成人的健康组织

Para_01
  1. 健康的成人胃肠道组织由剑桥转化医学生物库(CBTM)从已故器官捐献者(n=2)处获取,经过伦理批准(REC 15/EE/0152,东英格兰–剑桥南研究伦理委员会)和捐赠者家属的知情同意。
  2. 处理的胃肠道区域和捐赠者信息汇总于补充表5。
  3. 捐赠者用冷的威斯康星大学(UW)溶液灌注,从循环停止后1小时内收集远端胃(幽门/胃窦)、十二指肠和末端回肠的新鲜组织,并储存在4°C的HypoThermosol FRS保存液(H4416,Sigma)中直至处理。
  4. 肠组织纵向切开并用D-PBS冲洗,然后按照标准协议处理成单细胞悬浮液。
  5. 对于来自供体A68/759B(D105)的组织,上皮和固有层通过解剖分离成不同的部分。
  6. 上皮细胞通过在含有5 mM EDTA(15575020,赛默飞世尔科技),10 mM HEPES(42401042,Gibco),2%(v/v)FCS以及10 mM Rho激酶抑制剂(Y-27632(Y0503,默克))的汉克斯平衡盐溶液(HBSS)中洗涤两次而去除,同时在4°C下摇晃20分钟。
  7. 上皮洗脱物在4°C下以300g离心7分钟,然后在37°C下与补充了0.1 mg ml^-1 DNA酶I(11284932001,Sigma)的TrypLE(赛默飞世尔科技)孵育5分钟。
  8. 细胞沉淀并通过40-μm细胞筛过滤,重悬于含10%(v/v)FCS的高级DMEM F12(12634028,赛默飞世尔科技)中。
  9. 剩余的上皮耗尽的组织被切碎,并在消化介质(HBSS介质,0.25 mg ml^-1 Liberase TL(5401020001,罗氏)和0.1 mg ml^-1 DNA酶I(11284932001,Sigma))中于37°C摇床中孵育最多45分钟。
  10. 每15分钟使用P1000移液管轻轻匀浆一次组织。
  11. 对于来自供体A68/770C(D99)的组织,全层组织用手术刀切成小块,并如上述方法在消化介质中消化。
  12. 细胞沉淀并通过70-μm筛网过滤,然后按照制造商的说明进行Chromium 10x Genomics单细胞5′ v2协议。
  13. 文库按照制造商的协议制备,并在Illumina NovaSeq 6000 S2流动池上以50-bp配对末端读取的方式测序。
Control tissue from preterm infants

早产儿的对照组织

Para_01
  1. 从胎龄23到31周(pcw)患有坏死性小肠结肠炎(NEC)、局灶性肠穿孔或肠瘘的早产儿中收集了未受累组织(n = 4),这些组织在纽卡斯尔泰恩医院NHS基金会信托的新生儿科获得同意和伦理批准后作为SERVIS研究的一部分(REC 10/H0908/39)收集。
  2. 从婴儿身上切除组织后立即放入冰冷的PBS中。
  3. 在3小时内,使用IV型胶原酶(Worthington)在37°C下处理30分钟,将样本酶解成单细胞悬液。
  4. 细胞通过100-µm细胞筛过滤,用红细胞裂解液处理,并通过35-µm筛过滤。
  5. 细胞用DAPI染色,然后进行FACS分选,仅选择活的单细胞,并分离CD45阳性和CD45阴性的细胞。
  6. 分选后的细胞被加载到Chromium Controller(10x Genomics)上,使用单细胞免疫分析试剂盒,随后按照制造商的协议进行测序。
Disease tissue from patients with Crohn’s disease, ulcerative colitis and coeliac disease
Ethical approval for collection of disease tissue

疾病组织收集的伦理批准

Para_01
  1. 在奥斯陆大学医院收集的组织已获得地区医学研究伦理委员会(REK 20521/6544,REK 2015/946 和 REK 2018/703,挪威东南部健康区)的批准,并符合赫尔辛基宣言。
  2. 在巴塞罗那克林尼克医院收集的组织已获得巴塞罗那克林尼克医院伦理委员会(HCB/2016/0389)的批准。
  3. 来自阿登布鲁克医院的组织通过阿登布鲁克-人类研究组织库 HTA 研究许可证号:12315(剑桥大学医院信托基金)收集。
  4. 在 OUHFT 收集的组织是在牛津胃肠疾病生物库(REC 21/TH/0206)下收集的。

Single-molecule fluorescence in situ hybridization

单分子荧光原位杂交

Para_01
  1. 将肠组织嵌入 OCT 并在异戊烷-干冰混合物中于 -60°C 冷冻,然后以 10 μm 厚度切片到 SuperFrost Plus 玻片上。
  2. 染色前,将组织切片在 4°C 下用含 4% 多聚甲醛的 PBS 固定 15 分钟,然后依次通过 50%、70% 和 100% 的乙醇脱水,每次 5 分钟。
  3. 使用 Leica BOND RX 自动化处理,并根据制造商的说明使用 RNAscope 多重荧光试剂盒 v2 测定(Bio-Techne,Advanced Cell Diagnostics)进行染色。
  4. 手动预处理后,自动处理包括使用蛋白酶 IV 在 30 分钟内进行表位检索,随后进行 RNAscope 探针杂交和使用 Opal 520、Opal 570 和 Opal 650 染料(Akoya Biosciences)的通道开发。
  5. 使用 Perkin Elmer Opera Phenix 高内涵筛选系统以共聚焦模式、1-μm Z 步长,使用 20× 水浸物镜(数值孔径 0.16,每像素 0.299 μm)对染色切片进行成像。
  6. 通道为:DAPI(激发 375 nm,发射 435-480 nm),Opal 520(激发 488 nm,发射 500-550 nm),Opal 570(激发 561 nm,发射 570-630 nm)和 Opal 650(激发 640 nm,发射 650-760 nm)。
  7. 第四个通道使用 TSA-生物素(TSA Plus 生物素试剂盒,Perkin Elmer)和链霉亲和素偶联的 Atto 425(Sigma-Aldrich)进行开发。

Immunohistochemistry

免疫组织化学

Para_01
  1. 对于在奥斯陆大学医院收集的样本,将福尔马林固定、石蜡包埋的组织切片连续切成4微米厚,并安装在Superfrost Plus载玻片(Thermo Fisher Scientific)上。
  2. 在最初的切片上进行苏木精-伊红染色,并由一位专家病理学家(F.L.J.)审查,随后的切片用于免疫组化研究。
  3. AB-PAS染色通过脱蜡福尔马林固定、石蜡包埋的样本,并用pH 2.5的阿利辛蓝(8GX)(AB)对酸性粘液进行染色,用过碘酸雪夫试剂(PAS)对中性粘液进行染色,如前所述。
Para_02
  1. 多重免疫染色使用 Ventana Discovery Ultra 自动切片染色机(Ventana 医疗系统,750-601,Roche)依次进行。
  2. 切片脱蜡后,通过在细胞条件缓冲液 1(DISC CC1 RUO,6414575001,Roche)中煮沸切片 48 分钟进行热诱导表位修复,随后用 DISC 抑制剂(7017944001,Roche)孵育 8 分钟。
  3. 使用的初级抗体如下:抗人 MUC6 克隆 CLH5 稀释度 1:400(RA0224-C.1,Scytek),抗人 MUC5AC 克隆 CLH2 稀释度 1:100(MAB2011,Sigma),抗人 CD3 兔多克隆稀释度 1:50(A0452,Dako),抗人 CD8 克隆 4B11 稀释度 1:30(MA1-80231,Leica Biosystems, Invitrogen),抗人 CD4 克隆 SP35 稀释度 1:30(MA5-16338,Thermo Fisher),抗 TCRδ 克隆 H-41 稀释度 1:100(sc-100289,Santa Cruz Biotechnology),抗人 FOXP3 克隆 236A/E7 稀释度 1:1,000(NBP-43316,Novus Biologicals),抗人 HLA-DRα 链克隆 TAL.1B5 稀释度 1:200(M0746,Dako),抗人 CD68 克隆 PG-M1 稀释度 1:100(M0876,Dako),抗人 CD20 克隆 L26 稀释度 1:200(M0755,Dako),抗人 TFF2 克隆 #366508 稀释度 1:1,000(MAB4077,RnD),抗人 TFF3 克隆 BSB-181 稀释度 1:1,000(BSB-3820-01,BioSB)和抗人泛角蛋白克隆 AE1/AE3/PCK26,即用型试剂(RTU)(Ventana 医疗系统,760-2595,Roche)。
Para_03
  1. 每种主要抗体均用抗体稀释剂(5266319001,Roche)稀释,孵育32分钟,然后用1倍反应缓冲液(浓缩液(10倍),5353955001,Roche)洗涤。
  2. OmniMap 抗小鼠辣根过氧化物酶(HRP)即用型(5269652001,Roche)二抗孵育16分钟,随后根据制造商的说明,使用稀释的 Opal 荧光团(Opal 6-Plex 检测试剂盒用于全片成像,原 Opal Polaris 7 色 IHC 自动检测试剂盒 NEL871001KT)孵育12分钟。
  3. 之后,使用 Ribo CC 溶液(DISC CC2,5266297001,Roche)和 DISC 抑制剂(7017944001,Roche)使结合的抗体变性并淬灭 HRP。
  4. 切片随后用 DAPI(DISC QD DAPI RUO,5268826001,Roche)复染8分钟,并用 ProLong Glass 抗褪色封片剂(Molecular Probes)封片。
  5. 成像使用 Vectra Polaris 多光谱全片扫描仪(PerkinElmer)进行。
  6. 使用浓度匹配的无关一抗作为阴性对照。
  7. 对于某些组织切片,结合的抗 CD3、抗 CD20、抗 MUC6 和抗 MUC5AC 一抗通过与辣根过氧化物酶偶联的二抗检测,使用自动化的 Ventana Discovery Ultra 系统和 DAB、紫色响应、黄色响应或青色响应的显色剂(ChromoMap DAB 检测试剂盒,5266645001;DISCOVERY 紫色试剂盒,07053983001;DISCOVERY 黄色试剂盒,07698445001;和 Discovery 青色-HRP 检测试剂盒),所有这些都来自 Ventana 医疗系统。
Para_04
  1. 对于巴塞罗那医院诊所收集的样本,将甲醛固定、石蜡包埋的组织切片切成3.5微米的切片。
  2. 使用了以下商业可用抗体进行免疫组化:抗人MUC5AC(1:4,000;MAB2011,Sigma-Aldrich)和抗人MUC6(1:4,000;RA0224-C.1,ScyTek)。
  3. 切片的脱蜡、再水化和表位修复使用PT link(Agilent)自动化完成,采用Envision Flex Target Retrieval Solution Low pH(Dako)。
  4. 样品用20%山羊血清(Vector)在PBS和0.5% BSA溶液中封闭。
  5. 使用生物素化的抗小鼠二抗(1:200;Vector)。
  6. 阳性信号通过DAB底物试剂盒(K3468,Dako)检测。
  7. 图像采集在日本产Nikon Ti显微镜上进行,使用Nis-Elements Basic Research软件(v5.30.05)

Image quantification

图像量化

Para_01
  1. 为了量化克罗恩病患者(n = 5 个切片,3 名供体)和乳糜泻患者(n = 2 个切片,2 名供体)MUC6+ 和邻近对照上皮中的 T 细胞密度,使用了对 MUC6、CD3、CD4、CD8 和 TCRδ 抗体染色的组织切片(见上文)。
  2. 手动使用 PathViewer v3.4.0 自由手绘区域工具标注单个腺体/上皮(无论是 MUC6+ 还是 MUC6−),勾勒出整个腺体横截面。
  3. 我们从每个通道的自体荧光测量值中减去了 3 × 3 像素平均值,减法系数为:DAPI(1.5)、TCRγδ(0.5)、MUC6(1.0)、CD4(0.25)、CD3(0.25)和 CD8(0.25)。
  4. 接下来,我们使用 QuPath v0.5 与 cellpose v2.2.3 扩展来分割 T 细胞,使用‘cyto2’模型从 CD3、CD4、CD8 和 TCRγδ 的最大投影图中分割细胞,其中 DAPI 作为核标记,预期中位直径为 10 μm,并排除直径小于 5 μm 的细胞。
  5. 通过手动检查,将分割后的细胞根据 T 细胞标志物的平均强度表达进行阈值处理,阈值分别为大于 25(CD3)、大于 20(CD4)、大于 10(CD8)和大于 10(TCRδ),并根据阳性或阴性标志物表达将其分类为不同的亚群。
  6. 利用细胞质心位置,如果细胞大部分面积位于感兴趣区域内,则计算每个腺体内的 T 细胞数量,并比较 MUC6+ 和对照上皮中的 T 细胞密度。

Data curation and mapping

数据管理和映射

Para_01
  1. 数据集(补充表 1)是从 scRNA-seq 研究的文献搜索中选择的。
  2. 当研究包含来自人类胃肠道组织(口腔(不包括舌头)、唾液腺、食道、胃和小肠及大肠)的原始 scRNA-seq 数据(FASTQ)时,这些研究被纳入其中。
Para_02
  1. 每个样本的可用元数据从各种数据存储库收集并统一命名。
  2. 与样本采集方法、组织处理和细胞富集方法相关的元数据从原始研究的方法部分获取。
  3. 在可能的情况下,考虑了肠道细胞图谱路线图手稿中的样本元数据建议。
  4. 有关图谱中包含和统一的元数据的解释和概述可在补充表 2 中找到。
Para_03
  1. 对于提交到 ArrayExpress 的公共数据集,从欧洲核苷酸档案馆(ENA)或 ArrayExpress 下载了存档的配对末端 FASTQ 文件。
  2. 对于提交到基因表达综合数据库(GEO)的公共数据集,如果序列读取归档(SRA)不包含条形码读取,使用 srapath v2.11.0 获取提交的 10X bam 文件的 URL。
  3. 然后下载 bam 文件,并使用 10x bamtofastq v1.3.2 转换为 FASTQ 文件。
  4. 如果 SRA 归档包含条形码读取,则从 ENA 下载 SRA 归档,并使用 fastq-dump v2.11.0 转换为 FASTQ 文件。
  5. 样本元数据从提交到 GEO 或 ArrayExpress 的摘要以及出版物的补充文件中收集。
Para_04
  1. 在生成 FASTQ 文件后,使用了在 https://github.com/cellgeni/STARsolo 中详细描述的 STARsolo 管道 v1.0 处理 10X Chromium 单细胞 RNA 测序实验。
  2. 简而言之,使用了 STAR v2.7.9a。
  3. 根据 10X 在线协议(https://support.10xgenomics.com/single-cell-gene-expression/software/release-notes/build#header)中的描述,准备了一个与 Cell Ranger 2020-A 人类转录组完全匹配的参考。
  4. 使用自动脚本 ‘starsolo_10x_auto.sh’ 自动推断样本类型(3′ 或 5′,10X 套件版本等)。
  5. 使用了优化后的 STARsolo 命令,以生成尽可能接近 Cell Ranger v6 的结果。
  6. 为此,使用了以下参数来指定唯一分子标识符(UMI)折叠、条形码折叠和读段剪裁算法:‘--soloUMIdedup 1MM_CR --soloCBmatchWLtype 1MM_multi_Nbase_pseudocounts --soloUMIfiltering MultiGeneUMI_CR --clipAdapterType CellRanger4 --outFilterScoreMin 30’。
  7. 为了细胞过滤,调用了 Cell Ranger v4 及以上版本中使用的 EmptyDrops 算法,使用 ‘--soloCellFilter EmptyDrops_CR’ 选项。
  8. 使用 ‘--soloFeatures Gene GeneFull Velocyto’ 选项生成仅外显子和全长(前 mRNA)基因计数,以及 RNA 速度输出矩阵。
Para_05
  1. 在读取比对和量化之后,使用默认参数的 Cellbender v0.2.0 来去除环境 RNA(汤)。
  2. 在模型学习曲线未显示收敛的情况下,脚本将重新运行,参数设置为‘--learning-rate 0.00005 --epochs 300’。
  3. 对于某些大型数据集或低 UMI 数量的数据集,‘--expected-cells’和‘--low-count-threshold’参数需要根据每个样本单独调整。

scAutoQC

自动质量控制

Para_01
  1. 每个样本基础上,scAutoQC 计算了以下指标:每个细胞的计数对数值(log1p_n_counts),每个细胞的基因数量对数值(log1p_n_genes)以及表达的总基因中线粒体基因(percent_mito)、核糖体基因(percent_ribo)、血红蛋白基因(percent_hb)的比例,在给定细胞中表达最高的前50个基因中的比例(percent_top50),被CellBender分类为背景噪声的比例(percent_soup)和剪接基因的比例(percent_spliced)。
  2. 这八个指标的维度被减少,以生成每个样本的邻域图和UMAP,然后在低分辨率下进行聚类;这些聚类被称为质量控制(QC)聚类。
  3. 细胞/液滴是否通过质量控制(QC)的分类随后通过两步过程完成,首先根据由高斯混合模型(GMM)设定的四个指标参数和阈值将每个细胞分类为通过或未通过QC。
  4. 对于图谱,GMM组件的数量设置为10以形成过拟合模型。
  5. scAutoQC 随后进行了改进,基于贝叶斯信息准则自动选择1到10个组件之间的最佳模型拟合。
  6. 然后,如果集群内50%或更多的单个细胞通过了QC,则整个集群被分类为通过QC。
  7. 这种方法的好处包括自动化性质,去除了大多数手动设置的阈值,并限制了人工分析。
  8. 我们的无偏方法利用了各个指标的分布及其相关性。
  9. 尽管有一些预先设定的参数,但它们仅作为最终标记低质量细胞的指导,对起始点的小变化不敏感(例如,将初始线粒体基因百分比设置为15%或20%可能会标记相同的集群)。
  10. 管道的概述见扩展数据图2,代码(https://github.com/Teichlab/sctk/blob/master/sctk/_pipeline.py v0.1.1)和示例工作流程(https://teichlab.github.io/sctk/index.html)可以在GitHub上找到。

Assembly of the healthy reference

健康参考序列的组装

Para_01
  1. 样品通过 scAutoQC 处理后,将它们合并,并标记未通过质量控制的细胞,以及少于 10% 的细胞或总共 100 个细胞通过质量控制的样本(18 个样本)。
  2. 在这一初步过滤步骤中,我们共移除了 596,449 个(占 31.22%)低质量细胞。
  3. 细胞进一步通过基于 scrublet 得分的自动化双细胞去除进行过滤,从健康参考样本中又移除了 67,846 个细胞(扩展数据图 2)。
  4. 来自健康/对照样本的细胞使用 scVI(v0.16.4)整合,使用 donorID_unified 作为批次键,log1p_n_counts 和 percent_mito 作为连续协变量,去除了细胞周期基因,并选择了 7,500 个高变基因。
  5. 为了比较,我们使用 Harmony(v0.1.7)和 BBKNN(v1.4.1),同样以 donorID_unified 作为批次键,通过标准的 scIB 基准测试管道(v1.1.4)进行了整合,评估了基于 donorID_unified 作为批次键的批次校正指标。

Annotations of the healthy reference

健康参考的注释

Para_01
  1. 核心图谱中的细胞通过 Scanpy (v1.8.0) 的 leiden 聚类方法根据标志基因表达分为七个广泛的谱系(注释级别 1;扩展数据图 1a)。
  2. 每个谱系被拆分,并使用 scVI 重新整合(使用上述设置但选择 5,000 个高变基因,并排除谱系依赖的基因列表:所有非上皮亚群中去除细胞周期基因,所有上皮亚群中去除核糖体基因,B/B 浆细胞中去除可变免疫球蛋白基因),以精细分辨率注释细胞(注释级别 3)。
  3. 间充质群体进一步按发育年龄组划分(第一孕期胎儿、第二孕期胎儿/早产和成人/儿科)。
  4. 上皮细胞进一步按胃肠道区域和/或发育年龄组划分(口腔所有年龄段,食道所有年龄段,胃所有年龄段,小肠第一孕期胎儿,小肠第二孕期胎儿/早产,小肠成人/儿科,大肠第一孕期,大肠第二孕期胎儿/早产,大肠成人/儿科)。
  5. 为了对对象进行细致的注释(如果适用,包括年龄/区域),采用了结合自动注释与 leiden 聚类和标志基因分析的方法。
  6. 使用各种相关模型(Cells_Intestinal_Tract v2, Immune_All_Low v2 和 Pan_Fetal_Human v2 基于研究)以及基于肠道和唾液腺数据集的自定义标签转移模型,计算了整个核心图谱的 Celltypist 预测标签。
  7. 在注释过程中,基于共表达不同细胞类型标志基因、scrublet 分数、基因计数、相对于其他细胞的位置和 CellTypist 预测等因素的组合方法,手动去除了更多的双峰。
  8. 所有注释的笔记本均可通过我们的 GitHub 获取(https://github.com/Teichlab/PanGIAtlas)。
  9. 健康参考中小肠中的 MGN 细胞(MUC6+)在健康十二指肠中通过 leiden 聚类分辨率 0.5 识别,并通过子聚类进一步精炼,以去除任何残留的双峰或 MUC6− 细胞。

Data projection and label prediction for diseased data

疾病数据的数据投影和标签预测

Para_01
  1. 为了包含疾病数据,我们从原始数据开始,重新映射并应用了scAutoQC到疾病数据上,确保健康和疾病参考数据是可比较的。
  2. 使用scANVI(不包括双倍体)在完整的健康参考数据集上构建了疾病预测模型,该模型结合了广泛的(一级)注释,基于健康参考的scVI模型。
  3. 我们使用scArches和scANVI模型对疾病数据进行了投影。
  4. 为了进行精细标注,我们首先使用基于多数投票的k近邻方法在投影的疾病数据中预测了广泛的一级谱系。
  5. 然后将广泛的谱系按照健康参考的方式分割。
  6. 对于所有非上皮谱系,特定谱系的疾病细胞被投影到相应的健康参考谱系特定的潜在空间,并使用与广泛谱系预测相同的方法预测细粒度注释。
  7. 由于上皮细胞代表性不足,我们增加了来自乳糜泻十二指肠(Klenerman实验室未发表的数据(M.E.B.F.,未发表))和克罗恩病回肠和结肠的额外上皮细胞数据,使患病的上皮细胞数量从57,406增加到92,342个细胞,加上来自健康对照/非炎症组织的额外219,472个细胞。
  8. 这些额外的数据集没有重新映射,而是基于原始计数矩阵添加了这些研究。
  9. 从原始疾病集(重新映射数据)和额外的疾病集(来自计数矩阵)中分离出的上皮细胞被连接起来,并减少到一个共有基因集,共18,485个基因。
  10. 得到的上皮细胞数据集进一步按区域(胃、小肠和大肠)分割,使用scANVI_prepare_anndata函数(为非重叠基因填充0)准备投影,并投影到相应的健康参考上皮区域特定的潜在空间嵌入。
Para_02
  1. 为了精炼三级注释中的疾病细胞,我们利用了 scArches 加权 kNN 不确定性度量。
  2. 如果细胞的‘不确定性得分’超过每个谱系的第 90 个百分位数,则将其标记为未知。
  3. 对于上皮细胞,分别计算癌细胞和非癌细胞的第 90 个百分位数,以考虑肿瘤细胞高不确定性标签的情况。
  4. 为了精炼这些未知细胞的标签,我们进行了 Leiden 聚类(分辨率 = 1),并根据较高确定性细胞(高于阈值)的多数投票和标志基因重新分配标签。
  5. 在胃上皮中,有一群未知细胞,可能是癌细胞,无法分配标签,因此仍然标注为未知。
  6. 在大肠上皮中,我们发现了一群与化生潘氏细胞相对应的细胞(这种细胞类型在健康参考样本中不存在),基于独特的标志基因进行了重新注释。

Technical and biological variation

技术和生物变异

Para_01
  1. 为了确定不同元数据协变量对健康参考数据集成嵌入的贡献,我们对每个嵌入的潜在成分与每个协变量进行了线性回归分析,方法如前所述。
  2. 我们根据 level_1_annot(广泛水平)和 level_2_annot(中等水平)注释按细胞类型进行分析,并针对所有年龄或仅成人/儿童(排除发育中和早产样本)进行分析。
  3. 需要注意的是,尽管这种分析可以提供信息,但我们的图谱中包含的许多协变量是相关的,例如特定研究中的组织处理方法、疾病、年龄或器官。
  4. 因此,多个协变量可以解释数据中的相同方差。

Differential abundance analysis

差异丰度分析

Para_01
  1. 为了识别不同的细胞群体,我们使用了 Milo83(Milopy v0.0.999),该工具用于从 kNN 图中测试不同丰度的邻域。
  2. 对于健康发育(6-31 周胎龄,包括子宫外的早产儿)和成人/儿科肠道之间的比较,Milo 分别对每个组中有超过两个捐赠者的组织(胃、十二指肠、回肠和结肠)运行,使用默认参数。
  3. 对于健康成人肠道(18 岁或以上)中器官之间的比较,Milo 针对每个器官(口腔黏膜、唾液腺、食道、胃、小肠、大肠和肠系膜淋巴结)与其余器官组合进行运行,协变量为组织分数和统一的细胞分数,其余参数保持默认。
  4. 对于疾病样本与健康成人样本之间的比较,Milo 在单个研究中比较疾病组和对照组,而不是图谱中的所有疾病组和对照组,在联合嵌入的 kNN 图上运行,这已被证明在检测疾病相关细胞状态方面具有更高的敏感性。
  5. 我们专注于比较 Martin(2019)数据集中炎症区域与其邻近的炎症组织。

Differential gene expression analysis

差异基因表达分析

Para_01
  1. 差异基因表达(DGE)分析使用了Scanpy的rank基因组函数(Wilcoxon秩和检验,默认参数)和/或通过伪批量(decoupler85)以及DESeq2(参考文献86)分析完成。
  2. 对于Scanpy DGE分析,样本通过下采样处理至每种细胞类型每个供体200个细胞,并去除了与核糖体相关的和线粒体相关的基因以限制不必要的批次和技术效应。
  3. Decoupler伪批量(v1.5.0)通过组合供体-细胞类型组合完成,对每个组合中的细胞按基因汇总原始计数。
  4. 然后使用DESeq2(v1.38.0)进行DGE分析,使用ashr(v2.2_63)估计器计算log2(倍数变化)(log2FC)收缩。
  5. 当log2FC ≥ 0.5或log2FC ≤ −0.5且调整后的P值≤0.05时,将基因分类为差异表达。
  6. 为了比较化生Paneth细胞、INFLAREs和口腔黏膜成纤维细胞与健康对照,伪批量所需的最小细胞数为2,且DESeq2运行时不包含协变量。
  7. 对于口腔黏膜成纤维细胞,比较是在健康口腔黏膜中的口腔黏膜成纤维细胞与疾病回肠中标注为口腔黏膜成纤维细胞的炎症成纤维细胞之间进行的。
  8. 对于所有其他比较,最小细胞数为10,研究被作为协变量包括在内,比较是在IBD患者的小肠细胞与健康对照之间进行的。
  9. DESeq2在GSE126299 LCM数据集的批量数据上运行,比较了IBD患者的化生腺体和炎症上皮,使用默认设置,不包含协变量。
  10. 对于基因集分析,从Scanpy排名基因组的输出中筛选出具有最小log倍数变化0.25和P值截止0.05的基因。
  11. 使用GSEApy(v1.0.4)的enrichr功能,使用相关基因集如MSigDB、KEGG和GO生物过程进行基因集分析。
  12. 上皮细胞的基因得分使用Drug2Cell87得分函数与默认参数计算。
  13. 成纤维细胞的基因得分使用Scanpy的score_genes函数与默认参数计算。
  14. 用于基因得分的完整基因列表见补充表6。
  15. 不同胃肠道区域中MGN和INFLARE标记基因重叠的比值比和P值使用GeneOverlap88(v0.99.0)计算,基因组背景设定为18,485个基因,即用于标记基因分析的总基因数。

Cell–cell interaction analysis

细胞间相互作用分析

Para_01
  1. 使用 LIANA+(v1.0.4)、CellChat(v1.1.1)和 CellPhoneDB v3(统计方法)分析了克罗恩病期间小肠中的细胞间相互作用。
  2. 为了防止合并额外计数矩阵时丢失基因或相互作用,对重新映射的数据进行了交互分析(有关详细信息,请参阅‘疾病数据的数据投影和标签预测’部分)。
  3. 分析前,数据通过下采样处理,每种细胞类型每名供体保留50个细胞。
  4. 带有细胞注释元数据的归一化计数矩阵通过标准的 CellChat 和 CellPhoneDB 流程处理,通信概率截断均值/阈值设置为0.1。
  5. LIANA+ 分析的输出进一步使用 NMF 进行分析,考虑了至少在5%的细胞中表达的配体-受体平均表达量。
  6. 该分析通过自动肘部选择程序得出了10个相互作用程序。
  7. 使用 decoupler 的单变量线性模型方法对结果配体-受体加载进行通路富集分析,通路先验知识来自 PROGENy;仅包括至少有一条通路显著富集(错误发现率 ≤ 0.05)的因素进行分析。
  8. 使用上述描述的 DESeq2 差异分析统计数据,我们生成了 IBD 与健康状态之间失调的配体-受体相互作用列表,或者对于 INFLAREs 和口腔黏膜成纤维细胞,将疾病细胞与其相应的健康对照进行比较(见上文)。

cNMF analysis

cNMF分析

Para_01
  1. 为了识别共享活动和细胞身份基因程序,我们分析了来自患病小肠(克罗恩病、儿科IBD和乳糜泻,总计99,465个细胞)的原始计数,使用cNMF(v1.3.4)进行分析。
  2. 我们使用了cNMF的默认处理和标准化方法,该方法考虑了2,000个高变异基因以及100次NMF迭代。
  3. 所有其他参数均设置为默认值。
  4. 我们测试了超参数K(因子数量)的值,范围从5到80,步长为1,并通过检查选择了K=44作为因子稳定性和整体模型误差之间的有利权衡。
  5. 为了确定共识聚类,我们排除了6%的拟合cNMF谱,这些谱的平均距离到k近邻超过0.3。
  6. 所得的每个细胞基因程序使用情况与细粒度的细胞注释进行了比较,确定了与MGN细胞和其他相关细胞类型(杯状细胞、干细胞和表面凹陷细胞)身份相对应的基因程序。
  7. 为了评估健康或疾病特有的程序,我们使用相同的参数对来自小肠和大肠的所有细胞进行了分析,随机下采样至每种细胞类型每名供体200个细胞(共313,879个细胞)。
  8. 在这种情况下,我们测试了K的值,范围从10到80,步长为2,选择最优K=64。

Trajectory analysis

轨迹分析

Monocle3

单细胞3

Para_01
  1. 为了推断导致回肠 IBD 中 MGN 或 INFLARE 形成的发育轨迹,我们使用了 monocle3(v1.3.1)对包含来自研究中的回肠细胞的数据子集进行了分析。
  2. 我们在从 scANVI 隐空间生成的原始 UMAP 表示上执行了 Scanpy Louvain 聚类,以考虑批次效应,并通过选择分配到最多数量的上皮干细胞的节点作为根节点来推断沿伪时间的发育轨迹。
  3. 然后,我们通过选择分配到最多数量的 MGN 或 INFLARE 的节点作为最终节点,提取了特定于 MGN 或 INFLARE 的轨迹。
  4. 最后,我们使用 'monocle3::graph_test' 确定了沿伪时间表达变化的基因,该测试利用了 Moran’s I 测试,考虑了在主轨迹图上的 k = 25 个相邻细胞组内的基因表达变化。
Palantir

帕兰蒂尔

Para_01
  1. 我们分析了来自 IBD 患者回肠的上皮细胞轨迹,使用 Palantir(v1.3.1)进行基于转录组的伪时间估计。
  2. 在运行 Palantir 之前,我们使用上述‘健康参考组装’中描述的设置,通过 scVI 重新整合了数据集。
Para_02
  1. 我们使用了 Palantir 的默认参数,指定了 500 个路标点,并用具有最大基因得分(使用 Scanpy 排序基因函数)的 LGR5、ASCL2、RGMB 和 OLFM4 来指定根细胞。
  2. 然后,我们计算了一个 CellRank 内核(马尔可夫转移概率矩阵),用于 Palantir 假时间,以便将方向性的细胞状态转换投影到 UMAP 上。
  3. 为了预测宏观状态(潜在的终末细胞状态),我们在马尔可夫矩阵上运行了 CellRank 的广义佩龙聚类分析,然后计算了每个细胞在每个终末状态谱系下的命运概率。
  4. 我们使用 CellRank 推断和广义加性模型计算了沿干细胞 → TA → INFLARE 谱系的顶级谱系驱动基因。
  5. 所有相应的可视化都是使用 CellRank 包中可用的绘图功能制作的。
Genes2Genes trajectory alignment

基因轨迹对齐

Para_01
  1. 我们使用 Genes2Genes (G2G) 将 IBD 疾病中的 INFLARE 轨迹(干细胞 → TA → INFLARE)与另外三条不同的轨迹进行了比较:(1) 健康十二指肠中的干细胞 → MGN 轨迹,(2) 疾病回肠中的干细胞 → 吸收细胞轨迹,(3) 疾病回肠中的干细胞 → 杯状细胞轨迹。
Para_02
  1. 准备用于比较的轨迹。对于比较 1,我们对健康小肠上皮细胞进行了 scVI 整合和 Palantir 假时间分析,以便于在健康十二指肠中重建干细胞 → MGN 轨迹。
  2. 为了更有信心,我们还只选取了伪时间估计值小于 INFLARE 人群平均伪时间的干细胞和 TA 细胞(因为在 INFLARE 假时间范围内有一些异常的干细胞/TA 细胞具有更高的伪时间值)。
  3. 对于比较 2 和 3,我们使用了已经估计的 Palantir 假时间。为了高可信度地提取特定谱系的细胞,我们评估了非特定谱系细胞类型下注释的所有细胞(即,作为未注释为干细胞、TA 或 INFLARE 的细胞的阴性对照)中 INFLARE 谱系的命运概率分布(由 Palantir 估计),如果干细胞和 TA 细胞的命运概率低于阴性对照的第 75 百分位数,则将其移除。
Para_03
  1. 轨迹对齐。G2G 通过运行一个优化时间点之间基因表达分布匹配和不匹配的动态规划算法,将基因沿着参考轨迹和查询轨迹对齐。
  2. 此功能基于最小消息长度推断框架制定对齐成本。
  3. 根据 G2G 工作流程,我们首先使用 optbinning 包推断出的最佳分箱数量,将每个伪时间轨迹在等长间隔处分割成插值时间点。
  4. 然后,我们为三个轨迹比较中的每一个运行 G2G(在其默认设置下),使用每个细胞的 log1p 归一化基因表达和伪时间估计来对齐转录因子。
  5. 对于比较 1,我们考虑了健康和疾病数据集之间共有的 1,171 个转录因子,而比较 2 和 3 中则对齐了 1,262 个共有转录因子。
  6. 检查 G2G 对齐的输出时,当转录因子的对齐相似度 ≤ 50%,且最优对齐成本 ≥ 30 比特(以香农信息单位计)时,我们认为轨迹之间存在不匹配。

Bulk RNA-seq deconvolution

批量 RNA 测序解卷积

Para_01
  1. 为了进行批量反卷积分析,我们首先从 GEO 数据库(GSE111889)下载了成人 IBD 的已发表批量 RNA-seq 数据集,从 ArrayExpress 数据库(E-MTAB-5464)和 Expression Atlas(E-GEOD-101794)下载了儿童 IBD 的数据集,使用 R 包 TCGAbiolinks(v2.18.0)从癌症基因组图谱下载了结肠腺癌的数据集,从 GEO 下载了乳糜泻的数据(GSE131705 和 GSE145358),以及激光捕获显微切割的幽门化生、炎症和对照上皮的 RNA-seq 数据(GSE126299)。
  2. 然后通过将总体对象子集化,仅包括 IBD 中小肠的细胞,并对每个细粒度细胞类型注释下采样至 200 个细胞,准备了用于反卷积分析的单细胞参考。
  3. 使用 BayesPrism98(v2.0)进行反卷积分析,输入包括单细胞和批量 RNA-seq 数据的原始计数。
  4. ‘细胞类型标签’和‘细胞状态标签’均设置为细粒度注释。
  5. 从单细胞数据中移除了核糖体蛋白基因和线粒体基因,因为它们在区分细胞类型方面没有信息性,且可能是大量虚假变异的来源。
  6. 根据 BayesPrism 教程的建议,我们还排除了来自性染色体和低表达的基因。
  7. 为了进一步分析,我们应用了成对的 Welch t 检验来选择差异表达基因,其中‘pval.max’设置为 0.05,‘lfc.min’设置为 0.1。
  8. 最后,使用 new.prism() 函数创建了一个包含运行 BayesPrism 所需所有数据的棱镜对象,并使用 run.prism() 函数进行了反卷积。
  9. 对于相关性分析,我们计算了(1)估计的 INFLAREs 丰度与其他细胞类型的 Pearson 相关性,以及(2)估计的 INFLAREs 丰度与批量 RNA-seq 数据集中基因表达的相关性。
  10. 对于后者的计算,我们首先使用 R 包 DESeq2 对每个批量数据集中的表达矩阵的原始计数进行了归一化。
  11. 为了估计批量 RNA-seq 数据中具有 INFLAREs 的患者数量,我们根据 MUC6 表达量高于平均值加两倍标准差的阈值对样本进行了分类,将超过此阈值的患者归类为 MUC6 高表达。

Reporting summary

报告摘要

Para_01
  1. 关于研究设计的更多信息,请参阅本文链接的《自然组合报告摘要》。

Data availability

Para_01
  1. 成人样本的原始测序数据可通过ArrayExpress获得,访问号为E-MTAB-14050。
  2. 已发布的数据集可通过GEO、ArrayExpress、欧洲基因-表型档案、BioProject和Broad研究所单细胞门户轻松访问,访问号为GSE152042、GSE188478、GSE180544、E-MTAB-11536、E-MTAB-9543、E-MTAB-9536、E-MTAB-8901、GSE159929、E-MTAB-9489、GSE121380、GSE157477、E-MTAB-8007、E-MTAB-8474、E-MTAB-8484、E-MTAB-8486、GSE167297、GSE150290、GSE114374、EGAS00001003779、E-MTAB-8410、GSE122846、PRJEB31843、GSE134809、GSE161267、GSE116222、GSE182270、GSE125970、GSE164241、E-MTAB-10187、E-MTAB-10268和SCP1884,这些数据集也在补充表1中有详细说明。
  3. 已发布的批量RNA-seq数据集可通过GEO、ArrayExpress和Expression Atlas获得,访问号为GSE111889、E-MTAB-5464、E-GEOD-101794、GSE131705、GSE145358和GSE126299。
  4. 图像数据可从欧洲生物信息学研究所(EBI)BioImage存档下载,访问号为S-BIAD1139。
  5. 所有相关的处理过的单细胞对象和模型,用于未来项目,可在https://gutcellatlas.org/pangi.html获取。

Code availability

Para_01
  1. scAutoQC 的代码在 GitHub 上容易获取,并且可以通过 PyPI 安装(https://github.com/Teichlab/sctk)。
  2. 包括图谱组装、注释和下游分析在内的附加代码在方法部分有详细描述,并可在 GitHub 上获得(https://github.com/Teichlab/PanGIAtlas)。
  3. 所有分析和绘图均在标准 Python(v3.8 或更高版本)和 R(v4.0.4)环境中完成,使用了方法部分提到的第三方库;标准数据结构和单细胞实验数据结构;以及基本库:numpy、scipy、pandas、scikit-learn、statsmodels、python-igraph、seaborn、matplotlib 和 ggplot2。
  4. 所有图像分析均使用 PathViewer、QuPath、cellpose 和 OMERO.web 进行。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Information
  • Abstract
  • Main
  • Pan-gastrointestinal data integration
  • Cellular changes in the healthy gastrointestinal tract
  • Disease-relevant cell dynamics in IBD
  • Epithelial metaplasia in gut disease
  • Origin of INFLAREs
  • Dual role of INFLAREs in disease
  • Discussion
  • Methods
    • Patient samples and tissue processing
      • Healthy tissue from adults
      • Control tissue from preterm infants
      • Disease tissue from patients with Crohn’s disease, ulcerative colitis and coeliac disease
      • Ethical approval for collection of disease tissue
    • Single-molecule fluorescence in situ hybridization
    • Immunohistochemistry
    • Image quantification
    • Data curation and mapping
    • scAutoQC
    • Assembly of the healthy reference
    • Annotations of the healthy reference
    • Data projection and label prediction for diseased data
    • Technical and biological variation
    • Differential abundance analysis
    • Differential gene expression analysis
    • Cell–cell interaction analysis
    • cNMF analysis
    • Trajectory analysis
      • Monocle3
      • Palantir
      • Genes2Genes trajectory alignment
    • Bulk RNA-seq deconvolution
    • Reporting summary
  • Data availability
  • Code availability
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档