前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Science:人类神经科学中的功能基因组学和系统生物学

Science:人类神经科学中的功能基因组学和系统生物学

原创
作者头像
悦影科技
发布2024-01-08 08:44:52
2060
发布2024-01-08 08:44:52
举报

1. 摘要

由于对资源建设和工具开发的强大的财政和智力支持,神经科学研究已经进入了神经基因组学领域的关键发展阶段。以前的组织异质性的挑战已经遇到了技术的应用,可以让我们研究单个细胞尺度的功能轮廓。此外,以细胞类型特异性的方式干扰基因、基因调控元件和神经元活性的能力已经与基因表达研究相结合,以在系统水平上揭示基因组的功能基础。虽然这些见解必须基于模型系统,但由于人类遗传学、大脑成像和组织收集方面的进步,我们现在有机会将这些方法应用于人类和人体组织中。我们承认,在我们将模型系统中开发的基因组工具应用于人类神经科学的程度上,可能总是有限制的;然而,正如我们在这个角度所描述的,神经科学领域现在已经为解决这一雄心勃勃的挑战奠定了最佳基础。将系统级的网络分析应用于这些数据集,将有助于对人类神经基因组学的更深入的理解,否则,这是无法从直接可观察到的现象中实现的。

2. 引言

人脑是生物科学的关键前沿领域之一,功能基因组学和系统生物学能够为基因组和全脑范围内的分子机制提供独特的见解。在过去的十年里,通过推进创新神经技术(大脑)倡议的大脑研究计划和人类大脑项目激发了研究理解神经系统的基本机制和转化方法的创新。这些发展帮助人们快速跟踪神经科学研究,赶上并可以说超越了其他正在进行的长期研究项目,比如癌症研究项目。自从我们上次回顾神经科学中功能基因组学和系统生物学的发展以来的近15年里,在工具开发和发现方面都取得了显著的进展。例如,已经在细胞类型水平上进行了深度转录组定位,以生成大脑图谱以及来自假设测试研究的详细的大脑转录组数据集。这些细胞类型的基因组数据集已经与电路映射和生理数据联系起来,基因组工具已经被用来直接操纵大脑回路和行为。然而,这些见解中有许多已经来源于并应用于模型系统,如啮齿类动物或非人类灵长类动物。因为我们不能像使用这些模型系统那样直接在人类身上进行实验,所以这些发现是否直接适用于人类的大脑仍然是未知的。因此,神经科学领域需要考虑如何利用这些模型系统数据来理解人类大脑的功能,以及如何使用总结性网络分析从可用的“快照”人类数据集中梳理出额外的意义。

正如我们下面所描述的,我们对人类大脑的理解正在更新和完善的细胞类型、电路和行为的数据。基因组学的进展已经与病毒工具和单细胞或大脑区域电路的电生理测量等方法相结合。基因组学的基本改进来自于测序数据中reads长度的增加。例如,在rna测序实验中,可以利用更长的测序来确定基因亚型使用在细胞类型功能中的影响。每字节信息的测序成本也降低了,产生了更深入的数据,其成本已使单个实验室能够负担得起。这导致了更多的全基因组被测序,并通过全基因组关联研究对一些大脑疾病的见解。通过流式细胞术或基于液滴的方法分离单个细胞,然后进行基因组表征,强调了人脑在细胞分辨率上的复杂性。这些发现包括罕见细胞类型的异质性如血管细胞或小胶质细胞,细胞类型或细胞状态与疾病,染色质状态和基因表达之间的关系在细胞分辨率,人类特有的识别细胞类型,发展血统信息带有或没有带有细胞条形码,和单个神经元的体细胞单核苷酸变异。

与模型系统甚至人类的其他组织相比,人类的大脑在活体个体中获取具有挑战性。因此,神经科学家不遗余力地指出:(1)在多个尺度上确定人类大脑和其他哺乳动物大脑之间的异同,以解释建模结果和治疗测试;(2)开发捕获部分活体人类脑组织的体外系统;(3)检查来自多能干细胞的人类脑细胞的分子、发育和功能特性。尽管神经科学在拥抱和应用功能基因组学方法方面不得不赶上其他领域,但我们认为,它现在开发和整合功能基因组学到大多数类型的研究问题方面处于最前沿。从基因组学和系统生物学的角度来看,哺乳动物大脑发育和功能的基本原理已经有了强有力的基础。此外,神经科学的主要学科,电生理学,已经与遗传输出(光遗传学)和全基因组表达(Patch-seq)的测量方法配对。专注于脑部疾病(如自闭症和神经退行性疾病)的研究人员已经在将这些基因组方法应用到他们的工具库中。因此,我们认为,功能基因组学的下一个时代应该直接关注于人类的大脑。人类遗传学的持续进展可以与我们对人类大脑基因组学和功能的日益增长的认识相结合。从这个角度来看,我们概述了已经取得的进展,以及我们认为令人兴奋的扩张机会仍然存在。

3. 调查转录组

在过去的十年里,高通量基因组学技术已经改变了影响神经科学研究的数据资源,特别是在人类神经科学方面。这些技术已经成为神经科学研究和整个社区的支柱,部分原因是由美国国立卫生研究院(NIH)大脑倡议的投资推动的。这些跨越三个联盟和几十个辅助项目的努力主要集中于大脑内单个细胞特征的工具开发。这些努力将来自跨学科的个体聚集在一起,并使大脑特征描述中的多种模式的耦合成为可能。通过对个体和多组数据的研究,扩展了我们对细胞类型特异性特性如何相互关联的理解。从这些努力中,我们现在明白了,使用传统的单细胞转录方法的快照数据可以捕获大脑中存在的许多细胞类型和功能多样性。在来自健康大脑的人类样本中,在大脑疾病和疾病的背景下,这些数据集为假设生成、模型系统实验验证和开发新的分析方法的能力提供参考(框1)。然而,大脑功能的重要细节只能通过整合不同模式之间的信息来获取。这些努力的结论强调了(1)电生理和形态学特征不能被转录组学完全预测;(2)空间背景比单独的转录分析允许更多的异质性;(3)表观遗传图谱提供了必要的细微差别,特别是在考虑到状态转变或发展的时候。

框1. 相关的人类单细胞数据集存储库

已发表的人类大脑单细胞数据集以及数据的位置和类型的关键例子。

图片
图片

在人类样本中,从整体转录组学开始,稳态表达的特征已经成为理解大脑和脊髓的基础,突出了在整个大脑区域和发育过程中被激活的重要基因程序。虽然图谱的生成的性质已经进化,最初的RNA原位杂交和微阵列图谱的成人和发展中的人类大脑从艾伦大脑研究所仍然广泛和有效地作为参考基准研究在人类分析和系统。随着单细胞方法的出现,这种图谱的概念已经大大扩展。从大脑的努力行动,人类细胞图谱,白板和其他举措由个人实验室已经开始合并转录组定义有多少细胞类型可能存在于老鼠和人类的大脑,和最新的努力正在实现这些分析的空间细胞类型分布。这些数据收集在dbGAP、NeMP档案、CellxGene浏览器、突触或加州大学圣克鲁兹分校(UCSC)细胞浏览器等存储库中,并在框1中详细说明。

最终,这些稳态表达的研究完全依赖于转录组数据,并尚未完全扩展到用于啮齿动物系统的其他数据采集模式。这在一定程度上是由于在试图实施空间方法时,由于成人大脑中存在脂褐素等现象,不得不用于人类样本的更复杂的方法所面临的挑战。其他方法,如电生理测量,需要获得专门的样本和长期培养条件,以实现相关的特征。

因此,现有的对人类细胞的调查是高度以转录组为中心的,有一些测量开放染色质或甲基化状态。虽然这些数据的质量在单细胞中空间通常增加了,使广泛的单元格类型成为可能,这些数据集的效用仍然存在局限性。例如,单核测序技术的出现使得对难以分离的组织的研究成为可能,比如人类成人大脑样本和储存的人类样本。然而,这种方法(以及单细胞谱)仍然可能遭受环境RNA含量过多的问题,这种现象在分析前将细胞质RNA释放到细胞悬液中,阻碍了实验单细胞性质的准确性。在研究神经胶质细胞群时,这些问题尤其具有挑战性,因为由于它们自然表达的基因数量较少,它们更有可能被错误分型。此外,即使这些模式很好地代表了样本,不同模式生物在大脑区域、发育阶段或某些疾病状态方面也存在差距。这些差距在人类数据集获取的背景下尤其明显,因为样本的可用性和现有联盟的范围尚未产生全面的细胞类型图谱。

联盟正在对人类大脑地图谱的努力,给在这些健康或患病大脑的领域工作的研究人员提出了一个有趣的悖论。联盟的资源和分配方法可以产生假设,并且对单个实验室令人难以置信地有用,但是跨区域、时间点和疾病状态缺失的数据点可能会降低当前人类数据集的效用。然而,成本和被大群体“抢先”的可能性降低了小群体追求填补这些空白的激励和机会。对大型研究所和联盟努力的计划范围的透明度,再加上更低成本的单细胞图谱取样技术的进步,将有助于更有效地填补这些空白。重要的是,研究人类生物学和疾病的研究人员最适合审查和优化这些技术上具有挑战性的方法所产生的数据,并能很好地填补与人类神经科学相关的“缺失”数据集和模式的空白。

4. 用组学来表征突触

神经系统的独特特征是通过突触的复杂信息流,以及神经元和其他细胞类型之间的连接。人类的大脑被认为包含了大约600万亿个突触。与其他物种相比,人类每个神经元有更多的突触,突触功能障碍甚至轻微的调节失调与许多发育、精神和神经退行性疾病有关。因此,研究突触生物学的工具对于真正理解大脑生物学是必要的。此外,鉴于从上述图谱中鉴定出数千种细胞类型,细胞类型特异性突触相互作用的特征是表型、行为和稳态数据之间的诱人联系。短暂的突触连接也是关键发育过程的一个标志——例如,在丘脑皮层传入和发育中的短暂细胞类型和皮层的亚结构之间;因此,通过基因组生物学建立突触的研究是下一代神经科学的一个独特和基本的特征。

在这方面已经取得了显著的进展。大量的蛋白质组学特征已经从不同的物种和跨疾病的背景中产生,特别是在健康的大脑和神经退行性疾病的背景下。然而,最近的工作也强调了在突触蛋白质组的细胞类型特异性蛋白质组学研究之间发现的有趣的异质性。鉴于准确测量人体组织中电生理特性的挑战,在整体或单细胞水平上的突触生物学研究提供了从保存的组织中了解人类特殊过程的独特一瞥。例如,最近对发育过程中突触蛋白质组学的研究强调了对人类新生期机制的潜在见解。在衰老和神经退行性变的背景下,研究已经确定了淀粉样侧索硬化症和阿尔茨海默病中与疾病相关的突触蛋白,以及受年龄相关变化影响的突触蛋白和那些似乎对这些类型的降解有抵抗力的突触蛋白。

突触是一个独特的挑战,因为不仅在人类大脑中存在大量的突触,而且这些突触的具体特性可能是相当多样化的。考虑到人类大脑的大小,突触通常位于远离细胞体的位置,而将突触与原始细胞联系起来是非常具有挑战性的。用基于液滴的捕获方法来描述突触的单细胞基因表达的新工具正开始改变我们理解突触的组成和异质性的能力,以及它们在阿尔茨海默病等疾病状态下是如何失调的。然而,这些方法并不能解决相互作用细胞的细胞类型的问题,而且关于它们是否能准确地检测突触也有些争议。因此,在这一领域还需要更多的创新来充分理解人类大脑内突触的异质性。其他研究这个问题的策略正在出现——例如,捕获单个树突的创新突出了大鼠神经元局部翻译的关键特性。这些结果突出了从超越核转录本的亚细胞分析中获得信息的机会,强调了进行更全面的突触单细胞分析的必要性,特别是因为这在人类环境中是可获得的。

除了突触的特定内容外,了解这些信息在哪里被共享,对于单个细胞类型如何与来自不同区域的细胞通信具有重要意义。这将有助于更好地理解单个细胞如何促进最终导致行为基础的电路,并在疾病中可能发生失调。早期在啮齿类动物中研究细胞和功能之间的重要联系的开创性努力,利用了狂犬病毒感染神经系统并通过逆行轴突运输传播的独特特性。对该系统的工程改造已经消除了病毒的极端影响,反而能够靶向追踪一个个体,基因标记的细胞,通常来自啮齿类动物的大脑。随着单细胞技术的出现,这些类型的方法现在可以与单细胞分析配对,从而将单个细胞和与其通信的细胞连接起来。在神经元和神经胶质细胞群之间,这些方法的使用扩大了我们对突触前网络结构的理解,以及属于特定类别的相互作用比例的理解,包括识别轴突引导分子在神经胶质细胞相互作用中的作用。这些方法现在正在扩展到空间环境中,将细胞类型和连接位置与以前感染了定制突触示踪剂的大脑中的原位测序结合起来。具有一些细胞特异性的平行工具是腺相关病毒策略,可标记感兴趣的细胞类型,并可用于体外切片,以绘制投影和形态。然而,在人类生物学中,这些追踪工具的一个重要警告是,它们只能应用于活组织的切片,例如,这限制了它们在皮层内关系中的效用。尽管它们仍在快速发展,但这些工具扩展了我们完全理解突触功能的能力。然而,它们需要可操作的体内系统来进行全面的表征,例如从啮齿动物到非人类灵长类动物的模型生物。然而,人类神经元具有许多独特的特性,包括内在兴奋性降低,顶端树突长度增加和更多的回路区域化。鉴于直接评估的挑战,这些属性在人类外植体文化,进步的能力使用异种移植的神经元来自人类多能干细胞到小鼠大脑是一个令人兴奋的方法来探索人类神经元形态和电路。利用这些工具,我们观察到人类神经元在啮齿类动物的大脑中成熟,但本质上保持了它们的新生状态(延长的发育时间轴)。这些类型的实验模型是很有前途的系统,可以应用不断扩大的单细胞方法的工具包来研究突触生物学。获得价值从这些工具直接在人类生物学的背景下,这是必要的适应生活死后培养模型的人体组织,探索其效用在体外人体模型系统,并连接发现追踪啮齿动物模型其他基因表达和突触蛋白质组数据。这些适应将决定这些特征是否可以从人类环境中可接受的措施中推断出来。

5. 从列表移动到网络

如上所述,技术改进以及联盟和倡议已经产生了大量的基因组数据,其中大部分与人类大脑有关。这些努力已经产生了与细胞类型、发育轨迹和/或疾病状态相关的基因目录。然而,这些数据集带来的最大挑战之一是决定如何整合和确定信息的优先级。换句话说,确定哪些基因对特定的发育过程、表型或疾病最为重要。由于单个基因不能确定特定的细胞类型,我们需要考虑群体或网络中的基因。在大组织RNA测序的时代,通过使用与其他已知的基因组或生物信息无关的方法,促进了这一挑战。加权基因共表达网络分析(WGCNA)是一种流行的系统化大脑基因组数据集的方法。这种方法根据基因的共表达模式将基因分成多个模块。在每个模块中,似乎与共表达模式最相关的基因可以被优先排序为枢纽基因。值得注意的是,当从大量基因组数据集开始时,WGCNA对于提取与细胞类型相关的共表达签名很有用。对于单细胞数据集,WGCNA适用于已经定义的主要细胞类型或具有动态细胞类型特异性表达的数据集,如在发育数据集的情况下(图1)。例如,在发育中的人类大脑中,基因表达的动态模式使定义细胞的亚型具有挑战性,模块可以通过细胞类型生成,然后重新聚集以获得更干净的亚群。在其他关于人类初级组织和/或类器官的研究中,WGCNA已被应用于观察定义的网络如何在发育时间或物种之间发生变化。WGCNA和相关的共表达方法的使用将是应用于尚未得到充分探索的人类大脑区域和疾病状态领域的关键。基因网络对人类神经基因组学领域的复兴可以提供额外的细微差别,说明生物过程并不一定总是完全平行的细胞类型。然而,尽管WGCNA在单细胞模式的时代仍然相关,但当细胞类型的异质性已经明显和定义时,WGCNA在单细胞数据集上的应用可能会受到限制。此外,由于单细胞数据集往往更稀疏,有多个零(由于技术或生物学原因),由于数据点的稀疏性或数量,WGCNA的实现可能具有挑战性。稀疏性可以通过对每个细胞类型进行更深入的分析(例如,使用SMART-seq或Fluidigm)、计算缺失的数据点或跨细胞类型的基因的伪填充值来解决。

图片
图片

图1. 挖掘人脑单细胞数据集来推断调节机制。人类脑组织可以在RNA和染色质水平上查询基因组信息。然而,这些数据集需要进一步的应用分析来理解数据集的动态性质。WGCNA可以用来理解细胞类型的组成和贡献,以及细胞类型发育的动态性质。GRNs可用于推断哪些转录因子可能对特定细胞类型中的基因组的共同调控很重要。由于这些调节机制不能直接在人类体内进行测试,它们可以在人类大脑切片培养或啮齿动物或猴子等模型系统中进行测试。

因此,其他方法,如基因调控网络(GRNs)是重要的,需要挖掘单细胞数据集,以确定功能相关性。在最简单的层面上,GRNs的实现识别了由转录因子调控的基因,并将其大规模构建成一个网络。在一个scRNA-seq数据集中,这转化为在细胞类型分辨率下确定转录因子基序(图1)。因此,我们可以以一种细胞类型特定的方式绘制假定的共同调控(即通过相同的转录因子调控)基因。GRNs可以应用于scRNA-seq,也可以应用于单细胞染色质数据,如snATAC-seq。RNA和染色质数据集的分层和整合是构建功能网络的关键,特别是在人类大脑数据集中,因为测试功能结果的扰动是有限的。RNA和染色质在细胞类型水平上的结合有助于识别基因和调节机制(通过在不同大脑状态(如发育和疾病)中存在差异的基因组区域的基序和变异挖掘),并对应于基因表达的变化。虽然应用一些最新的GRNs方法多模态数据集已被证明可以提高GRNs方法的预测能力整体,限制甚至这些最近的基准方法,一些类型的数据如验证转录因子结合位点或增强启动子链接没有充分观察。就人类数据集而言,确认任何结果的能力都相对受限,这是所有这些方法所面临的重要挑战之一。WGCNA和GRNs都是可预测的,而不是确定的因果关系。换句话说,这些都是需要进行独立验证的假设生成方法。对于GRNs生成的转录因子网络,可以使用细胞类型特异性转座酶和标记方法,如单细胞CUT&Tag来验证特定转录因子的靶基因。我们设想这种方法可以将抗体应用于转录因子(如使用组蛋白修饰物的有效抗体),并将该方法应用于人类大脑样本。

除了WGCNA和GRNs等经常使用的方法外,挖掘多模态基因组数据集的其他方法正在出现。一种因果推理方法,CoCoA-diff,已被应用于来自阿尔茨海默病脑组织的单细胞RNA-seq数据,促进了细胞类型特异性基因的优先排序,这些基因可能是疾病状态的驱动因素。最近一种包括人类脑组织的机器学习方法是基因形成工具。来自人类脑组织的单细胞RNA-seq数据被包含在基因的大型训练数据集中,网络预测拷贝数变异(即剂量)对发育性疾病基因的贡献具有更高的准确性。将深度学习等人工智能方法应用于单细胞转录组学是一件非常令人兴奋的事情。然而,在这些工具如何预测人脑等系统的功能网络方面,仍然存在挑战和未知,除了选择的方式外,不会受到干扰。

集成数据集的假设测试可以通过silico方法进行,如CellOracle,基因组扰动方法,如扰动PerturbSeq或大规模并行报告分析。然而,这些在人类环境下的操作需要可访问的人类大脑模型,要么是细胞数量的巨大规模,要么是有限的基因集,因为每个引导RNA的细胞数量需要得出可靠的结论。这些类型的操作是一种理想的情况,其中干细胞来源的人类神经元或正常发育或神经发育障碍的类器官系统的模型可以实现相关的扰动。然而,由于这些模型的体外性质,对来自原始样本的现有数据集进行基准测试,并包括充足的细胞系和技术复制,对于确保观察到的表型不是系统的人工产物至关重要。

最后,许多研究,特别是那些通过大脑倡议资助的研究,他们的任务是设定RNA和染色质模式的目标,由于现有的技术,现在也包括了空间方法。由于单细胞方法必须将组织分离成单个细胞,空间转录组学的实现可以用于独立生成或验证跨人类大脑亚区域的细胞基因组数据集(例如,人类皮层部分)。人类空间转录组学的一个限制是人类大脑相对于成像窗口的绝对大小。然而,人们可以想象将人类大脑更大区域的数据集拼接在一起,以做出关键的空间相关见解。另一个需要考虑的因素是,可能需要覆盖人类大脑的大部分区域的成像时间(以及计算密集的分析)。然而,随着这些障碍的克服,空间转录组学可以扩展到人类大脑更大区域的切片培养,并与其他方法集成,询问功能数据,如连接和病毒基因操作,进一步弥合基因型到表型的差距。

6. 整合遗传和表型数据

研究人类大脑的最终目标是拼凑出我们行为背后的机制,特别是那些区分我们与其他物种的特征,比如语言。实现这一目标的一种方法是通过分析具有不同表型的广泛个体的遗传和基因组信息。这可以通过比较来自神经典型个体的数据集和那些具有不同行为症状的大脑疾病患者的数据集来实现,如神经发育障碍(例如,自闭症谱系障碍(ASD)或精神分裂症)或神经退行性疾病(例如,阿尔茨海默病)。由于不像在模型系统中那样在基因上干扰人类是可行的,因此我们可以将来自神经典型个体和来自疾病个体的数据进行比较,以推断人类大脑中基因和行为之间的相关性(图2a)。这些研究必须使用活体个体的外周组织,如血液或唾液(对于DNA变异),或使用死后的组织来获取大脑。尽管DNA多态性和拷贝数变异信息已经彻底改变了我们对罕见和常见变异对这些脑疾病风险的贡献的理解,但仍不完全清楚这些危险因素中的DNA改变如何以功能方式影响脑细胞。换句话说,我们仍然缺乏通过细胞和回路从DNA中推断出行为或疾病的因果关系的能力。这是神经基因组学领域在未来十年应该解决的一个重大的知识差距。此外,我们还面临着在缺乏直接来自脑组织的数据集的情况下,确定发育压力和/或大脑活动如何与遗传风险交叉的挑战。因此,研究人员需要在如何利用死后的脑组织来理解功能结果方面进行创新。利用死后组织的一个后勤挑战是,人类有不同的生活方式和人口统计数据,因此现有的数据集并不总是很好地匹配(例如,按年龄、其他人口统计数据、药物或治疗条件,或大脑区域)。大规模的数据集可以缓解这些问题。例如,英国生物样本库的数据集目前包含了来自数十万人的基因数据,以及相应的人口统计信息,以及来自数万人的一些表型信息和大脑成像。这些数据集提供了许多重要的见解,以了解基因变异是如何与大脑结构和功能测量相关的,挖掘这些数据集已经确定了可能构成这些表型的特定基因,以及与特定大脑疾病的联系。这些和相关研究的一个令人失望的结果是,无法识别与基于任务的功能磁共振数据相对应的重要基因信号——换句话说,是人类行为背后的遗传学。目前尚不清楚样本量的进一步增加或成像方法或行为任务的细化是否会改变这一结果。

图片
图片

图2.利用人类脑组织来发现与基因组学相关的多模态系统的综合方法。a,大脑成像可以与外周DNA谱相结合,以推断可能导致大脑大小或功能的基因变异。b,来自死后组织的大脑基因表达和染色质状态数据可以与功能MRI数据相结合,以了解基因表达模式如何可能是大脑活动的基础。c,人类死后组织可以用来证实其他方法的发现。d,可以从手术患者身上获得体外脑切片培养,并用于整合来自同一个体的生理和基因表达数据。

另一项最近的创新是将人类大脑成像与死后大脑基因表达数据集的集成(图2b)。在这些比较中,数据集来自两个不同的人群,但这些数据的相对稳定性在神经典型人口导致关键的基因组基础大脑形态大小、层压和细胞类型以及功能静息状态数据。这些功能成像数据集通常依赖于成像队列的大型存储库,如来自IMAGEN或人类典型个体的神经连接体项目,或与疾病相关的联盟,如ASD。许多这些整合研究也使用了由艾伦大脑研究所生成的人类脑图谱中的RNA-seq数据,但越来越多的研究开始增加更多的人类死后RNA-seq数据集。此外,纳入来自抑郁症、精神分裂症、ASD和其他神经发育障碍等多种疾病个体的成像和/或基因组数据集,导致识别出在疾病环境中有不同表达模式的基因。值得注意的是,这些基因不一定是与基因变异风险相关的相同基因,这表明遗传风险和功能基因组结果之间的复杂相互作用。除了使用来自疾病队列的数据外,还有一些努力将基因组学和大脑成像与人类相关的特定行为库联系起来,如语言。所有这些研究都为人类大脑的基因优先排序奠定了基础,并深入了解了一些基因组如何与一些大脑功能或疾病状态相关联。这些研究需要注意的是,死后组织数据来自不同队列的个体队列和那些接受成像的个体。因此,每个个体的人口统计数据可能具有挑战性,特别是如果考虑到疾病或发育数据集。

来自人类脑组织的基因表达数据集(例如,RNA-seq和/或ATAC-seq)的另一个重要来源是通过手术切除的脑组织。这些组织的使用排除了围绕独立群体相关性的问题,因为这些组织可以从之前接受过脑成像(结构或功能)、颅内刺激或电生理测量,如脑电图的个体中获得(图2d)。例如,一项参与者内部的研究确定了在记忆回忆任务中与特定振荡活动相关的基因表达模式,揭示了可能对正常的人类记忆功能很重要的特定基因。当然,对于使用手术切除的组织的一个主要警告是,所有提供组织的个人都要因抗药癫痫或癌症等疾病而接受手术。快速尸检组织的使用可以填补非大脑疾病患者组织的可用性和对整个大脑的获取方面的空白,而不是手术决定的地方。无论如何,无论是手术还是快速尸检来源都不可能为自闭症或阿尔茨海默病等认知障碍患者的脑组织基因组学提供丰富的资源。因此,在这些病例中,需要建立组间相关性来整合基因组学与大脑功能。

在细胞类型水平上,生物物理表型可以通过Patch-seq等方法与基因组数据集成,其中单个细胞进行膜片钳测量,然后进行scRNA-seq。Patch-seq已被大规模用于比较人类和小鼠的皮质细胞,识别在人类脑细胞中已被修改的特征,并在某些疾病中可能存在风险。这些努力可以通过在来自手术切除和/或快速解剖脑组织的器官型切片培养中操纵与疾病相关的基因或细胞类型来进一步扩大。人脑切片培养可以存活数周,并可接受病毒转导。再次,这些技术的应用脑组织个体特定的大脑疾病如ASD或阿尔茨海默病是有限的,但高质量的基因表达和监管数据从死后组织可以获得,这些信息可以应用于生理研究如操作关键的疾病相关基因在器官型切片。

重要的是,对于所有这些综合研究,与组织供体相关的详细表型信息是相互关联的关键基因组特征与人口统计学、疾病相关表型或技术方面的考虑。具有高标准最佳实践的协调脑库正在使这些组织随时提供给合格的研究人员(例如,国家卫生研究院神经生物库用于控制以及几种类型的大脑疾病和西蒙斯基金会脑网用于ASD和控制组织)。这些脑库面临的一个挑战是,如何在受疾病状态影响的发育和年龄相关时期收集足够的样本。尽管死后组织样本将反映稳定的表达水平,但Hi-C和ATAC方法的使用已经深入了解了分子和染色质特征的某些方面。

利用人类细胞类型表达模式或大脑回路的改变,来填补关于DNA变异如何导致行为改变的缺失,是利用非人类灵长类动物模型的力量。在道德上易于进行基因操纵的非人类灵长类动物模型(例如,狨猴或猕猴)在进化上仍然与人类距离很远,并且在细胞类型水平上存在许多基因组差异。然而,它们的大脑基因表达模式和回路也与人类大脑有许多共同的特征。因此,每个模型系统都应该基于与人类行为相关的特定假设来选择。例如,在声乐学习的研究中,鸣禽模型可能比大猿更可取,因为大猿没有表现出可观察到的声乐学习。

7. 共享人类数据

随着研究神经科学的基因组工具的改进和扩大,以解决与人类样本相关的技术挑战,利用捐赠的手术、活检或死后组织的研究数量正在迅速扩大。许多组织,包括NIH等资助机构,同时都在推动越来越开放的获取这些数据,包括原始测序读取。从科学上讲,这是合理的,因为对齐、解析亚型和其他改进差异基因表达的应用工具正在改进和扩展。更精简的访问将允许尚未概念化的工具的速度和效率。

然而,随着利用这些原始序列的工具的改进,推断这些数据中可识别特征的技术也在改进。例如,虽然低覆盖率的3′-enriched sequences曾经不可能用于识别单核苷酸多态性,工具和模型现在使相对高信心的单核苷酸多态性在这些测序数据集可行,他们被用于科学有趣的应用程序如解复用身份测序运行,追踪细胞之间的潜在血统关系,或在单细胞研究中识别肿瘤亚克隆。

这些同样的工具,当与在科学和社会环境中不断扩大的人类测序存储库相结合时,正在迅速接近适应能力,不仅能够识别个体,而且能够识别他们的亲属。这对大多数同意书带来了伦理风险,其中身份识别是研究使用样本的一个条件,并增加了对个人及其亲属的社会风险。直接拼写这些风险因素(表1)并不是危言耸听,而是针对测序数据没有得到充分保护时可能产生的危害的具体说明;更全面的访问必须对这些危害提供法律保护。关于家庭的考虑特别突出时处理死后组织存档旧同意形式不仅可能研究使用超出那些最初计划,但新技术可能扩大识别之前未知的遗传风险因素幸存的亲属可能没有咨询捐赠过程中。

表1. 围绕着使用人类数据集的伦理问题

图片
图片

因此,作为科学家和更广泛的社区,我们必须考虑,在提供住房、共享、使用或发布这些敏感数据时,必须保持哪些类型的数据保护防火墙和有关科学行为的社区准则。此外,当考虑数据或元数据的哪些方面将被共享时,现在必须在政策和科学决策中考虑对这些数据未来潜在使用的保护。

8. 结论及未来的发展方向

跨模式的数据集成仍然是人类大脑基因组学的一个具有挑战性的前沿。然而,随着对具有相关表型信息的人类脑组织的获取量的增加,基因和行为之间的差距应该会缩小。化学和脑成像技术的进展可能有助于查询体内基因表达的机制。当然,以单细胞分辨率成像活体人类大脑活动的可能性可能是可以实现的,并且所得到的数据可以与独立的基因组数据集成。

最重要的是,神经科学领域已经走过了很长时间的路,从不情愿地使用基因组方法和假设生成方法,到采用技术,以细胞分辨率描绘大脑,或整合电生理数据和基因表达数据。尽管模型系统在这些领域取得了重大进展,但在未来的十年里,神经科学研究肯定会突破观察和操纵人类大脑的界限。这些新的方法将使人类生物学的额外表征成为可能,而这里讨论的现有的综合分析方法可以继续推动对现有和新兴数据集的有凝聚力的生物学理解。对基因如何在从细胞到回路之间影响人类大脑的功能理解,将开启神经调节和基因操纵的新时代。因此,我们建议,继续努力深入研究人类大脑的基因组特征,以及这些特征如何在细胞、回路和行为中变化,将获得对人类大脑如何进化、发展、功能和功能障碍的丰富认识。确定这些基因特征如何通过人类大脑中的细胞和回路直接影响行为是一项具有挑战性的任务,可能需要新的任务技术进步这些成就不仅将增强我们对人类行为的理解,而且还将具有治疗价值。

参考文献:Functional genomics and systems biology in human neuroscience.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 摘要
  • 2. 引言
相关产品与服务
数据集成
数据集成(DataInLong)源于腾讯开源并孵化成功的 ASF 顶级项目 Apache InLong(应龙),依托 InLong 百万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程,在跨云跨网环境下提供可靠、安全、敏捷的全场景异构数据源集成能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档