前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Science Advances:人脑白质连接组的遗传结构

Science Advances:人脑白质连接组的遗传结构

原创
作者头像
悦影科技
发布2023-07-05 16:47:13
3280
发布2023-07-05 16:47:13
举报
文章被收录于专栏:脑电信号科研科普

 1. 摘要

白质束是大规模大脑网络的结构基础。我们使用30,810名成人(英国生物样本数据库)的扩散张量成像表征全脑束造影,发现90个节点水平和851个连边水平的网络连接测量具有显著的遗传性。多变量全基因组关联分析确定了325个基因位点,其中80%在这之前没有与大脑指标相关。富集分析涉及神经发育过程,包括神经发生、神经分化、神经迁移、神经投射引导和轴突发育,以及产前大脑表达,特别是在干细胞、星形胶质细胞、小胶质细胞和神经元中。

2. 引言

认知功能和行为是由大规模大脑网络中的神经信号的动态交互作用所支持的。神经信号沿着白质连接传播,连接皮层、皮层下和小脑区域,形成结构连接体。白质连接还可以调节神经信号,并在大脑区域之间分布营养因子,帮助建立和维持子网络的功能特化。各种遗传性精神和神经系统疾病可能涉及白质结构连接性的改变,例如,与认知缺陷、临床表现或恢复有关。因此,了解哪些DNA变异、基因和途径影响人类大脑中的白质连接是非常有趣的,因为它们可能影响人群的认知和行为变异,以及大脑疾病的易感性。

扩散张量成像(DTI)使大脑白质的体内无创研究成为可能。这种技术描述了水分子的扩散,由于轴突膜和髓鞘的限制,水分子优先平行于神经纤维发生。通常由DTI得到的指标,如分数各向异性或平均扩散率,反映了白质的微观结构,并可以指示其完整性。相比之下,纤维束造影涉及到在宏观解剖尺度上定义白质连接,这允许通过计算连接每对区域的流线来测量连接强度。当每个体素的主弥散张量与它的一些直接相邻体量对齐时,构造流线通过DTI数据中的多个相邻体素。因此,束造影产生了特定的区域互联测量,非常适合大脑网络水平的分析。

最近,全基因组关联研究(GWAS)报道,白质微观结构测量中个体间变异的相当大比例可以用常见的遗传变异来解释,基于单核苷酸多态性(SNP)的遗传力为22-66%。这些研究还确定了与白质微观结构测量相关的特定基因组位点。然而,微观结构测量并不一定能捕获宏观大脑网络的拓扑特性,比如遥远的大脑区域对之间的结构连接的总量。原则上,白质连接组拓扑特征的个体间变异可能受到遗传变异的影响,这些遗传变异与影响白质微观结构的遗传变异部分不同。例如,在长距离连接发育过程中,遗传对轴突生长和引导的影响可能通过束造影测量的连接强度检测到,而不一定影响这些连接的微观结构完整性。然而,据我们所知,神经纤维束造影以前没有用于大脑结构网络的大规模全基因组关联分析,可能是因为在数千上万的个体中运行神经束造影需要大量的计算。

在这里,我们的目的是利用纤维束造影来描述人脑白质结构网络连接的遗传结构。我们利用来自英国生物样本库成人数据集的30,810名被试的DTI数据,构建了每个个体的全脑结构连接网络。结合全基因组基因型数据,我们对纤维束造影衍生的指标进行了一组遗传分析,包括90个大脑区域网络节点和947条作为网络连接的特定区域对连接。一个节点(大脑区域)的总连接可能与其在多个子网中的信息传递中的全局作用有关,而特定区域对之间的个体连接是更受局部限制。因此,我们预计遗传对节点级和连边级网络测量的影响可能会产生的影响是不同的,其中一些遗传效应在更大的尺度上更相关,而另一些可能影响相对特定的环路。

我们的遗传分析包括基于SNP的遗传力估计、多变量GWAS(mvGWAS)和相关位点的生物学注释。然后,为了说明多变量基因-大脑关联是如何在数据中产生的,以及查询全脑mvGWAS结果如何与感兴趣的特定大脑网络之间的关系,我们利用这些结果来识别与左半球核心语言相关区域之间的结构连接相关的基因组位点。语言功能的各个方面——尤其是与语言产生相关的——表现出强烈的半球侧化,大约85%的人左半球占优势。

最后,我们评估了一般人群中大脑疾病和其他行为特征的遗传倾向如何以白质连接表现出来。为此,我们绘制了全脑白质束造影指标与各种遗传性脑疾病或行为特征的多基因评分之间的多变量关联:精神分裂症、双相情感障碍、自闭症、注意缺陷多动障碍、左利手人群、阿尔茨海默病、肌萎缩性侧索硬化症和癫痫。我们使用大规模的元分析功能神经成像数据,用认知功能注释了生成的大脑图谱,以描述在一般人群中可能受到不同形式神经分化的多基因倾向影响的脑功能方面。

3. 结果

3.1 30,810名成年人的白质连接组

对每个30810成人被试的扩散磁共振成像(MRI)和遗传数据质量控制后,我们进行了确定性纤维束造影之间的每一对区域定义的自动解剖标记地图集(每个半球45个区域包括大脑皮层和皮层下结构)(图1)。在每个个体的结构连接矩阵中,每个区域被认为是一个节点,一对区域之间的每个连接被认为是一条边。当超过20%的个体没有连接一对给定区域的流线时,我们排除了边缘,从而得到947条网络边。为了量化每个个体中给定的边,该边的流线计数除以被连接的两个区域的特定灰质体积。这些体积调整的网络边测量也被用于计算每个区域的节点级连接,即每个被试与给定区域连接的所有体积加权边缘度量的总和。在用于遗传分析之前,所得到的节点和边测量值根据人口统计学和协变量进行了调整,并在个体间进行了归一化。

图片
图片

图1. 个体大脑内白质网络构建示意图。通过将自动解剖标记图谱从公共MNI空间映射到单个空间来定义网络节点,每个半球有45个区域(包括皮层和皮层下结构)。每对区域之间的边被定义为基于相应的扩散张量图像的束造影构造的流线数,并根据两个连接区域的合并体积进行调整。该过程为30,810名被试中的每个被试生成了一个零对角对称的90×90无向连接矩阵(顶部三角形随后用于后续分析)。

在947条网络边中,377对连接的左半球区域,355对连接的右半球区域,215对涉及大脑半球间连接。连接性排名前10%的区域包括补充运动皮层、楔前叶、内侧额叶上皮层、双侧尾状体和丘脑的皮层下区域。后一种观察结果与之前的研究一致,即皮层下区域与大脑皮层广泛连接,产生皮层-皮层下的相互作用,共同支持许多认知功能。

3.2 连接测量的遗传力

使用GCTA(全基因组复杂性状分析)软件来估计每个网络测量的基于SNP的遗传力(h2),即每个连接测量的方差在多大程度上被常染色体的常见遗传变异解释(材料和方法)。所有90个节点水平(基于区域的)的连接测量都具有显著的遗传性(Bonferroni校正的P<0.05),范围从7.8到29.5%(平均h2 = 18.5%;图2A)。左右半球的同源节点相似,但半球间的遗传性差异显著,如顶下皮层(左27.0%对右19.42%)、三角部(左23.4%对右16.9%)、枕下皮层(左8.0%对右15.7%;图2A)。11个节点水平的连接显示h2估计>为25%,其中左半球颞上皮层最高(h2 = 29.5%,P < 1×10−20)。

947个连边水平的连接(即特定区域对之间的连接中有851个)显示出显著的遗传力(bonferroni校正的P < 0.05),范围为4.6到29.5%(平均9.6%)。11条边的h2 >为20%,主要用于连接额叶区域(如额叶上皮层和中额叶皮层)和补充运动皮叶和枕叶皮层(如楔叶和舌叶)的连接。左半球351条边的平均h2为9.9%,右半球333条边的平均h2为10.0%,167条半球间边的平均h2为8.1%(图2B)。在851个显著遗传的边中,遗传力与平均纤维长度不相关(rho = 0.01),表明短程和长层的白质连接总体上同样受到遗传变异的影响。

图片
图片

图2.基于SNP的遗传力和对30,810名被试的节点级连接和连边级连接的mvGWAS分析。(A)经过Bonferroni校正后,所有90个节点水平(即区域)连接均显示出显著的SNP遗传力,范围为7.8-29.5%。(B)经Bonferroni校正后,947个连边水平连接中的851个显示出显著的SNP遗传力,范围为4.6-29.5%。遗传力可以在一个基于web的动态界面中进行交互式的可视化。(C)为mvGWAS的90个节点级连接(顶部)和851个连边级连接(底部)的Miami图。

遗传网络测量的可靠性评估使用1005年30810个人的大脑扫描经历了两个不同的场合(材料和方法):组内相关系数(ICCs)基于相同的处理管道应用于数据从第一次和第二次扫描访问的中位数为0.83(范围0.45到0.93)和90遗传连边水平测量的中位数为0.66(范围0.28到0.94)。测量信度与遗传力呈正相关:90个节点级连接的r为0.67, 851个可遗传的边缘级连接的r为0.60。这与在遗传力分析中,测量误差被分配给性状方差的“环境”(即非遗传)成分的事实相一致,因此较不可靠的测量往往遗传性较差。无论如何,我们推断所有显著遗传的网络测量都有足够可靠的测量变异,有助于后续的mvGWAS分析。这是因为检测遗传依赖于特征相似性增加成对的个体具有更高的遗传相似性,因此需要至少一小部分的特征方差被可靠地测量在个体内部,而单一基因位点只能解释非常少量的可遗传的方差。遗传力数据可以在基于web的动态界面中进行交互式可视化。

3.3 白质连接的多变量全基因组关联分析

多元综合统计测试(MOSTest)软件用于执行两个独立的mvGWAS分析,首先90节点级连接测量在一个多元全基因组中,然后851边缘连接在另一个多元全基因组,两次都与9803735 个SNP基因组。该分析通过同时建模基因在整个大脑中的影响的分布性质,分别检查了每个SNP与多个结构网络测量的关联(材料和方法)。利用FUMA在连锁不平衡(LD)的基础上对mvGWAS结果进行克隆,并在每个相关基因组位点上鉴定独立的先导SNP(材料和方法)。在P = 2.5×10−8的显著性水平上(即P = 5×10−8的标准GWAS显著性阈值,但经过两个mvGWAS的校正),我们在117个与节点水平连接相关的不同基因组位点上发现了140个领先SNPs(图2C)。以及在166个与边缘水平连接相关的不同基因组位点上的211个先导SNP(图2C)。在无关联的零假设下的排列分析表明,MOSTest正确地控制了I型错误。除21号染色体外,每条染色体至少有一个与节点水平或边缘水平连接相关的位点。

在节点水平mvGWAS和边缘水平mvGWAS之间发现26个先导SNP。虽然一定程度的重叠是鉴于节点级指标的计算是根据边缘级指标得出的(即,不是独立的),绝大多数的领先SNP检测涉及节点级或边缘级连接,但不是两者都是,这支持执行遗传关联分析的重要性在这些不同的网络水平。

对于每个领先SNP,MOSTest通过报告每个度量与该SNP的单变量关联的z分数表明了每个大脑度量对该SNP的贡献。节点水平的mvGWAS发现,最大z分数考虑在所有领先单核苷酸多态性是双边壳核(左侧平均|z| = 2.05,右侧平均|z| = 1.86),左苍白球(平均|z| = 2.02),双边中额叶皮层(左侧平均|z| = 1.98,右侧平均|z| = 1.89),和中扣带皮层(平均|z| = 1.82)。例如,左壳核的先导SNP(平均|z| = 2.05)中与12q23.3 的rs12146713(z=−10.48)、9q31.3的rs72748148(z = 7.35)、7p22.3的rs798528(z =−6.74)、11p11.2的rs7935166(z=6.22)和1q25.3的rs3795503(z=6.01)有很强的关联。

在边缘水平连接的mvGWAS中,所有先导SNP中显示高幅度z分数的边缘主要连接楔前叶、胼胝体、中颞叶、前和中央后回。连接左右楔前叶的边缘的SNP(平均|z| = 1.60)中贡献最大,10p12.31上的190646282_TA_T(z=−5.58)和3q28上的3:190646282_TA_T(z=−5.53)。

3.4 大多数与结构连接相关的基因组位点以前都未被确认

我们的节点水平连接的mvGWAS和边缘水平连接的mvGWAS共确定了325个先导的SNPs,其中只有101个先前与新GWAS目录中的至少一个性状相关。这表明,在结构连接中,大多数(68.92%)的位点未被以前的研究确定。有65个SNPs与之前的大脑测量GWAS中报道的相同。具体来说,我们的46个领先SNPs先前与脑区域体积相关,29个与区域皮质厚度相关,33个与区域皮质表面积相关,20个与白质微结构相关。除了大脑测量,11个单核苷酸多态性与心理健康特征(例如,自闭症、精神分裂症和焦虑)相关,11个单核苷酸多态性与认知功能(例如,认知能力和性能)相关,4个单核苷酸多态性与神经疾病(例如,阿尔茨海默病和癫痫)相关,和40个单核苷酸多态性与非大脑生理和物理变量(如腰臀比、胆固醇水平和肺功能)相关。此外,我们将我们的结果与最近报道的白质微结构完整性GWAS进行了比较,这些结果尚未存入GWAS目录:32个先导SNP与我们的mvGWAS分析重叠。

3.5 与结构连接相关的基因组位点的功能注释

我们使用FUMA通过三种策略:物理位置、表达数量性状位点(eQTL)信息和染色质相互作用。对于节点水平连接的mvGWAS,通过这三种策略鉴定出了879个独特的基因。140个先导SNPs中有95个至少有一个eQTL或染色质相互作用注释,表明这些变异(或与它们相关的高LD中的其他变异)影响基因表达。例如,11p11.2上的rs7935166(多变量z = 5.71,P = 1.15×10−8)是CD82的内含子,据报道CD82可促进少突胶质细胞分化和白质髓鞘化。该先导SNP是CD82的一个大脑eQTL,也显示了在成人大脑中通过CD82启动子的交叉位点染色质相互作用的证据。另一个例子是,6q21上的rs35396874(多变量z = 6.64,P = 3.17×10−11)影响其周围基因FOXO3的表达,这是TLR/AKT/FoxO3通路的核心元素,对修复少突胶质细胞祖细胞分化介导的白质损伤很重要。

对于边缘水平连接的mvGWAS,功能注释鉴定出1464个独特的基因。211个先导SNP中有135个至少有一个eQTL注释或染色质相互作用。例如,在3q26.31上的rs13084442(多变量z = 6.34,P = 2.32×10−10)是TNIK的一个eQTL,TNIK是一个与神经发生和智力残疾相关的基因。同样, q31.231上的rs284130514的SNP(多变量z = 6.28,P = 3.47×10−10)是DCLK2的eQTL重要轴突生长锥的形成和神经迁移,也在一个区域内与DCLK2的启动子神经祖细胞。作为进一步的例子, 4q24上的rs13107325等位基因C(节点水平连接的mvGWAS的多变量z = 5.77,P = 7.99×10−9和边缘水平连接的mvGWAS的多变量z = 8.74,P = 2.37×10−18)是一个错义编码变异基因SLC39A8显示高结合注释相关损耗得分23.1,这表明这个SNP是有害的(其频率为7.01%)。同样的SNP也与白质微结构的完整性、精神分裂症和儿童的行为问题有关。

3.6 大脑结构连接的基因关联分析和基因集富集分析

我们使用MAGMA(基因注释多标记分析)进行基于基因的关联分析,该分析结合了mvGWAS在给定基因内每个SNP关联的证据。对于节点水平的连接,我们鉴定了296个P<0.05的显著基因(经过Bonferroni校正后,检测20146个基因和两组mvGWAS结果),其中237种与上述三种策略(即物理位置、eQTL注释或染色质相互作用)中至少一种注释的策略重叠。然后将基于基因的P值作为输入,进行基因集富集分析,对比MSigDB数据库中之前定义的15,488个功能集。61个基因集显示显著富集(Bonferroni校正后P < 0.05,图3A),主要涉及神经发育过程,如“神经发生”(β = 0.18,P = 5.53×10−13;最显著的集合),“go_神经元分化”(β = 0.18,P = 1.55×10−10)和“go_神经分化相关细胞形态”(β = 0.25,P = 3.39×10−10)。

对于边缘水平的连接,我们鉴定了561个具有显著基因关联的基因(bonferroni校正的P < 0.05),其中444个与通过物理位置、eQTL注释或染色质相互作用定位的基因重叠。72组基因组显著,特别是与神经迁移和神经投射的发展有关,如“go_物质依赖的大脑皮层切向迁移”(β = 3.98,P = 2.61×10−14;最显著的集合)、“神经元投射引导”(β = 0.41,P = 8.59×10−12)和“轴突发育”(β = 0.29,P = 3.45×10−11)。

我们测试了来自BrainSpan数据库的全基因组人类基因表达数据的P值,根据11个寿命阶段或29个不同年龄组分组。与节点水平连接相关的基因在产前期平均上调,从早期(β = 0.04,P = 5.84×10−5)到晚期(β = 0.08,P = 1.01×10−5)或从9 (β = 0.002,P = 4.15×10−5)至26(β = 0.003,P = 1.18×10−3)孕后周(Bonferroni校正的P < 0.05;图3C)。同样,与边缘水平连接相关的基因在早期(β = 0.06,P=2035×10−8)至晚期(β = 0.06,P=10.01×10−3)产前或9(β=0.003,P=0.002×10−8)至24 (β = 0.003,P = 2.67×10−5)孕后周(Bonferroni校正P < 0.05;图3D)。

我们还检测了我们的全基因组、基于基因的关联P值,这两个独立的单细胞基因表达数据集来自不同年龄的人类前额叶皮质样本(GSE104276)。结合不同年龄组,在星形胶质细胞中观察到与节点水平连接(β = 0.05,P = 4.34×10−5)和边缘水平相关的基因的平均上调连接(β = 0.04,P = 1.27×10−3)(Bonferroni校正的P < 0.05;图3E和F)。按年龄划分,小胶质细胞(β=0.02,P = 3.72×10−5)和10周龄(GW)的干细胞(β=0.05,P3.51×10−4),190GW的星形胶质细胞(β=0.02,P=1.48×10−4)和26 GW的星形胶质细胞(β = 0.05,P = 1.35×10−7)和26 GW的伽马氨基丁酸能神经元(β = 0.04,P = 3.97×10−4)(图3E)。同样,与边缘水平连接相关的基因平均表达上调在10 GW的小胶质细胞(β = 0.02,P = 5.07×10−4)和10 GW的干细胞(β=0.06,P=5.18×10−6),16GW的神经元(β=0.06,P=9.32×10−5)和星形胶质细胞(β = 0.05,P = 3.50×10−6)和26 GW的伽马氨基丁酸能神经元(β = 0.05,P = 1.01×10−4;图3F)。

图片
图片

图3. 与成人白质连接变异相关的基因在特定的神经发育作用中被丰富。(A)61个功能定义的基因集显示出与节点水平的连接显著富集。(B)72个功能定义的基因集显示与边缘水平连接性显著富集。(C和D)根据来自11个生命阶段或29个年龄组的脑跨度数据,与(C)成人节点水平连接和(D)成人边缘水平连接变异相关的基因在产前的人类大脑中表现出上调。(E和F)基于产前大脑单个细胞基因表达数据,(E)成人基因在考虑所有产前年龄组周龄(GW)星形胶质细胞在19GW,26GWGABAergic神经元和星形胶质细胞分解发育阶段,同样,(F)成人边缘连接变化相关的基因考虑所有产前年龄组,在星形胶质细胞的10GW,神经元在16 GW,GABA能神经元和星形胶质细胞在发育阶段被分解。(C至F)黑线表示每次分析中经过Bonferroni校正后的显著性阈值P < 0.05。

3.7 左半球语言网络连接的遗传学

为了说明如何查询全脑mvGWAS结果与任何特定的大脑网络,我们选择了四个左半球区域对应的网络可靠激活的句子级语言任务的大多数人和语言,即下额叶皮层的盖和三角形部分(布洛卡区域)和上、中颞叶皮层(包括韦尼克区域;图4)。这四个节点由6条边连接,遗传力从7.3到17.1%,它们共同对应于弓状束,也可能包括通过钩状束的流线——两个涉及语言的显著纤维束(图4)。根据MOSTest得到的mevGWAS的211个在边缘水平连接的先导SNP中,有31个与这6个边缘中的至少一个显著相关。例如,3p11.1上的rs12636275位于EPHA3的内含子内,EPHA3是一个编码ephrin受体亚基的基因,该基因调控轴突投射图的形成,也与语言相关区域之间的功能连接有关。另一个例子是,2q33.1上的rs7580864是PLCL1的一个eQTL,与自闭症有关,自闭症是一种经常影响语言和社交技能的神经发育障碍。基于31个SNPs的其他位置候选基因包括CENPW,编码促肾上腺皮质激素释放激素受体1,以及参与染色体维持和细胞周期的CENPW(着丝粒蛋白W)(图4)。

图片
图片

图4. 左半球语言网络连接的遗传学。(A)在左半球语言网络中有四个具有核心功能的区域,包括经典定义的布罗卡(额叶)和韦尼克(颞叶)区域。同时还显示了连接这四个区域的六条边。(B)可视化的六个边缘的一个例子,红色代表盖部和三角部,绿色代表中颞部和颞上皮层之间的连接,黄金代表颞部和颞中皮层之间的连接,蓝色代表盖部和颞上皮层,紫色代表三角部和颞中皮层之间的连接,黄色代表三角部和颞上皮层之间的连接。(C)与全脑边缘连接mvGWAS最接近独立SNP的基因,显示与6个左半球语言网络边缘中的至少一个显著相关(Bonferroni校正在0.05)。

3.8 结构连接与大脑疾病和行为特征的多基因得分的多变量关联

对于30810个体研究样本,我们计算多基因分数(各种大脑疾病或行为特征显示与白质变化,使用先前发表的GWAS总结统计数据:精神分裂症,双相情感障碍、注意缺陷/多动障碍、左撇子、阿尔茨海默病、肌萎缩性侧索硬化症和癫痫(材料和方法)。有18个显著的偏相关(即根据人口统计学和技术协变量进行调整;见材料和方法)在这些多基因得分之间(bonferroni校正P < 0.05):16为正相关,精神分裂症和双相情感症(r=0.06,P<1×10−200),注意缺陷/多动障碍与自闭症(r = 0.33,P < 1×10−200)最高;有两个负相关,肌萎缩侧索硬化症和双相情感症多基因得分之间(r =−0.03,P=2.26×10−6)和肌萎缩性脊髓侧索硬化症和自闭症(r = −0.03, P = 8.81 × 10−6)。

另外,对于每一个多基因得分,我们使用典型相关分析来调查它们与30,810个个体的90个可遗传节点水平连通性度量的多变量关联。所有典型相关性都非常显著,包括精神分裂症: r = 0.07,P = 8.98×10−34;双相情感障碍: r = 0.07,P = 1.53×10−35;自闭症: r = 0.06,P = 7.87×10−24;注意缺陷/多动障碍:r = 0.08,P = 7.84×10−44;左利手: r = 0.07,P = 1.74×10−31;阿尔茨海默病: r = 0.07,P = 4.14×10−33;肌萎缩性侧索硬化症: r = 0.06,P = 1.29×10−25;癫痫: r = 0.05,P = 1.49×10−20。因此,在一般人群中,对这些各种疾病或行为特征的多基因倾向部分反映在大脑的白质连接上。

典型相关分析得出了每个上水平连接度量的负荷,反映了每个度量与给定障碍/行为特征的多基因倾向的关联的程度和方向。对于精神疾病,大多数负荷是负的,即,这些疾病的多基因风险增加往往与大脑区域的连通性降低而不是增加有关(图5)。这在精神分裂症(85个负的负荷区域,5个正的负荷区域)、双相情感障碍(81个负性,9个正性)和自闭症(64个负性,26个正性)的多基因风险中尤为明显。与节点水平连接增加(28个正的负荷)相比,多基因倾向也与节点水平连接降低(62个负的负荷)相关。相比之下,在英国生物样本库的数据中,阿尔茨海默病与62个白质连接增加有关,尽管一些已知的疾病病理区域显示连通性下降,如内侧颞叶皮层(69)。(当排除已知对阿尔茨海默病风险有显著个体影响的APOE位点时,这些结果保持稳定)。对肌萎缩性脊髓侧索硬化症的多基因风险进行了类似的观察,其中90个区域中有74个显示了阳性负荷(图5)。

对于每个多基因评分,我们确定了在典型相关分析中显示出最强负载的特定节点水平的连接性,即负载为>0.2或<−0.2的大脑区域。这些区域被用来为每个多基因评分创建一个单一的大脑掩膜,然后被用来查询14371个功能脑成像研究的神经合成器数据库。在这个过程中,根据数据库中的所有功能地图,为每个面具生成了一个全脑的共激活地图,然后将这些地图与数据库中研究的认知和行为术语特定地图相关联。

例如,精神分裂症多基因风险的面具由32个区域显示最强的与白质连接,分布在双侧颞、背腹、后扣带皮层(图5和表S28),有7个功能项相关性的相关激活图(图5,图。,包括“工作记忆”和“语言”。这表明,对精神分裂症的多基因倾向影响了大脑区域的连通性,特别是与工作记忆和语言有关(见讨论)。双相情感障碍多基因风险的面具包括30个区域,包括颞叶、内侧额叶、顶叶上、视觉皮层,以及海马体和尾状核,这些区域一起接受了“情绪”、工作记忆和语言相关过程的功能注释(图5B)。自闭症的多基因风险主要与右侧背外侧前额叶、右侧颞叶、右侧感觉运动和双侧视觉皮层以及左侧杏仁核的白质连接有关,这些区域均具有视觉、工作记忆、执行和注意功能(图5C)。左利手的多基因倾向与布罗卡区、左侧颞叶上叶皮层、左内侧前额叶和左侧视觉皮层以及右丘脑的节点水平连接相关,功能上具有语言相关的认知功能(图5E)。图5为所有障碍/性状多基因评分的等效图谱和功能注释。双相情感障碍和精神分裂症的多基因风险具有最相似的大脑图,在与这些多基因风险相关的节点水平结构连接方面(这20个多基因评分的负荷之间的r=0.56,跨越90个节点)。

图片
图片

图5. 在30,810名被试中,对各种脑相关疾病或行为特征的多基因倾向显示出与区域(节点水平)白质连接的多变量关联。典型相关分析表明,每个节点水平的连接与(A)精神分裂症、(B)双相情感障碍、(C)自闭症、(D)注意缺陷/多动障碍、(E)左撇子、(F)阿尔茨海默病、(G)肌萎缩性侧索硬化症和(H)癫痫的多基因得分相关。正负荷(红色)表示与特定疾病/行为特征的多基因倾向增加相关的更高节点水平的连接,而负负荷(蓝色)表示与特定障碍/行为特征的多基因倾向增加相关的更低节点水平的连接。Word云表示与区域(节点)地图相关的函数,显示每个多基因得分的最强负荷(|r| > 0.2)。使用大规模的荟萃分析功能神经成像数据(材料和方法)。单词云中的字体大小代表了这些术语的元分析功能映射与与每个多基因得分相关的区域集的共激活图之间的相关性大小。

4. 讨论

这项大规模的绘图研究使用了白质束造影和多变量分析来表征常见的遗传变异对成人大脑结构连接的个体差异的贡献。结构连接和对脑相关疾病或行为特征的多基因倾向之间的多变量关联也被描述为所涉及的大脑区域的功能激活。这些各种分析超过30000人的多个层次的生物组织:从基因和细胞类型通过发育阶段成人大脑结构和功能,行为和个体差异,意味着数以百计的基因组位点。

不同的大脑区域通过白质神经纤维相互连接;这一基本特性有服务于涉及认知和行为的功能网络。在一般人群的3万多名成年人中,我们发现白质连接的个体间差异尤其受到基因的影响(i)产前发育中活跃的大脑;(ii)在胚胎和胎儿大脑的干细胞、星形胶质细胞、小胶质细胞和神经元中表达上调;(iii)参与神经发育过程,包括神经迁移、神经投射引导和轴突发育等神经发育过程。成人白质连接的个体间差异可能源于神经发育,这与对大脑结构和功能变异其他方面的大规模成像遗传学研究的结果一致。这些统计富集结果为我们的mvGWAS发现提供了强有力的生物学验证,因为没有理由使这种与脑白质束明显相关的功能富集偶然发生。

星形胶质细胞是大脑中最大的一类神经胶质细胞,具有一系列已知的功能,包括神经元稳态和存活、调节突触发生和突触传递。不太为人知的是,在神经发育过程中,星形胶质细胞可以通过介导轴突尖端生长锥的吸引或排斥,表达信号素3a,这是神经元回路形成所必需的。在我们基于基因的关联分析中,SEMA3A是整个基因组中与边缘水平连通性相关最显著的个体基因。总之,我们的数据表明,在发育中的人类大脑中,纤维束的形成可能会受到星形胶质细胞提供的位置线索的显著影响。

关于小胶质细胞,这些吞噬细胞不仅具有免疫功能,而且还有助于去除死亡的神经元,修剪突触,以及调节神经元的活动。人们对它们在发展过程中的作用知之甚少,但是胚胎小胶质细胞在大脑中分布不均匀,并与轴突的发育有关,这再次表明了其在调节轴突生长和位置引导方面的作用。小鼠大脑没有小胶质细胞,或免疫激活小胶质细胞,显示异常多巴胺能轴突生长,而小胶质细胞功能的破坏或小胶质细胞的损耗导致失败的轴突粘附和形成束在胼胝体,大脑最大的纤维束。我们的数据支持了这一观察结果,通过表明人类胚胎大脑中小胶质细胞中上调的基因与成人白质连接的个体差异相关的变异而丰富。因此,星形胶质细胞和小胶质细胞在纤维束发育中的作用值得进一步研究。

虽然我们的研究结果特别指出了与神经发育有关的基因,但也有可能是对白质连接的一些基因影响在生命后期起作用。例如,星形胶质细胞和小胶质细胞可能影响成年期脑纤维束的维持和老化,与大脑疾病有关,并可能提示治疗靶点。我们绘制了各种脑相关疾病和行为特征的多基因得分与区域白质连接性之间的多变量关联,并使用元分析的功能成像数据对所得到的大脑地图进行了注释。一些地图和他们的注释符合问题的症状,例如,多基因倾向双相情感障碍与白质连接的大脑区域显著参与情绪,而多基因倾向注意力缺陷/多动障碍或自闭症与区域的连接重要的执行功能。左利手和精神分裂症的多基因得分与语言相关区域的连接相关,这与这两种特征中语言的左半球功能优势的改变相一致,以及它们之间的表型关联。左撇子性和精神分裂症的多基因得分也与语言相关区域的灰质结构不对称性的改变有关。

关于神经疾病的遗传风险,多基因得分阿尔茨海默氏症和肌萎缩性侧索硬化症与区域的连接重要的工作记忆,而多基因得分癫痫与连接的默认模式网络,一组大脑区域参与内部启动思想和语义和情景记忆。先前的分析白质束在阿尔茨海默氏症表明广泛的减少连接,所以这是出乎意料的,大多数的大脑区域在英国生物库成人数据集显示增加连接与更高的多基因疾病的风险,即使一些核心区域的病理显示降低预期的连接。肌萎缩性脊髓侧索硬化症也出现了类似的显著模式,其中多基因风险的增加与大多数大脑区域的结构连接的增加有关。这可能是某些区域的连接增加是对其他区域连接减少的补偿性重构,或者至少在多基因风险较高的人群中,白质连接相对保留,而皮质灰质减少。

与大规模单变量方法相比,我们使用的全脑mvGWAS方法为检测曲曲病毒基因组位点提供了较高的统计能力(16)。同时,可以在事后查询多变量结果,以识别与感兴趣的特定边缘级连通性相关的位点。我们通过查询连接左半球语言网络的四个核心区域的六个连接的结果来说明这一点,这些区域一起近似于布罗卡和韦尼克的经典定义的功能区域(46)。正如预期的那样,这些连接在一起形成了一个整体特征,非常类似于弓状束,以及一些通过钩状束的连接(图4),这是两个主要的语言相关束。

总之,我们的研究结果揭示了抑郁症功能MRI连接畸变的星形细胞机制,统一了抑郁症病理生理学中两个不同的重要概念,即显微星形胶质细胞功能障碍和宏观功能网络突发,使用细胞类型特异性神经调节方法和全脑成像。这些结果将有助于推进rsfMRI测量的功能网络作为高度定量和可重复的抑郁症成像和治疗生物工具的更具体和机械的解释。31个相关位点包括EPHA3位点,编码一个ephrin受体亚基,作为轴突投影图形成的位置引导线索,也与语言网络中特别涉及语义的区域组件之间的功能连接有关。因此,这是一个关于人类大脑语言网络的结构和功能连接的一致的基因发现。

在这项研究中,我们使用了确定性束造影,我们发现这在超过30,000个个体中是可行的(在集群服务器上处理大约需要4个月的时间)。另一种方法,概率束造影,通常在运行时间和存储需求方面要求更高,但也有优势,特别是它允许对每个体素的多个束方向进行建模,因此允许交叉纤维。然而,据报道,确定性纤维束造影往往比概率方法产生假阳性连接的可能性更低。这一点很重要,因为假阳性比假阴性对网络度量的正确计算更有害。类似地,Sarwaret 等人评估了鼻束造影模型的性能,并报告了确定性鼻束造影产生了最准确的连接体重建,特别是当忽略了与流线数量最少的连接时。因此,当在至少80%的被试中检测到时,我们只在结构连接矩阵中包含连接。应用该阈值从我们的研究中删除了3058个弱连接或伪连接,剩下947个可供进一步分析,其中851个具有显著的遗传力,并继续进行mvGWAS分析。这个阈值已经被发现适用于白质网络属性分析,因为它提供了一个在消除假阳性连接和创建假阴性连接之间的平衡。通过确定性束造影构建的解剖连接已经通过对死后的人脑的显微解剖得到了很好的证实,这表明了该方法的稳健性和可靠性。此外,在以往的弥散MRI研究中,确定性脑束造影已被广泛用于构建白质连接模式,该研究研究了神经发育、衰老和大脑疾病过程中的结构特征。

据报道,在应用基于DTI的束造影时,束特异性可能通过胼胝体等瓶颈而丢失,尽管其他研究报道确定性束造影可以通过胼胝体成功重建半球间连接。此外,通过传统弥散成像数据重建的胼胝体的半球间连通性得到了高角度分辨率弥散成像和死后白质解剖检查的支持。我们发现,半球间连接的平均遗传力仅略低于半球内连接,这表明半球间连接的测量足够可靠,有助于识别遗传效应。

我们使用AAL(自动解剖标记)图谱,在宏观水平上测量了根据分割定义的结构连接区域对。该图谱是在高分辨率结构成像的基础上手工神经解剖轮廓创建的。先前的研究发现,该图谱结合DTI数据,可靠地索引了结构连接。此外,AAL图集结合确定性束造影已应用于英国生物库数据集血管负荷和认知能力的研究,这表明鉴于该数据集的大尺寸和扫描分辨率,该方案是合适和实用的。此外,AAL图谱区域是在体积空间中定义的,因此可以一致地适用于整个皮层和皮层下结构,这是本研究的一个目标。使用基于体积的图谱,如AAL,也被证明比基于表面的图谱能更好地捕捉由皮质厚度或束形状引起的变化。AAL标记系统集成了来自沟部和脑回几何形状的解剖特征,而相对较大的区域有助于克服来自不同个体的大脑图像在空间配准和归一化过程中产生的可变性。虽然在未来的研究中应用不同的地图集将提供信息,但未检测到的区域间连接(即零流线)的百分比可能会随着更细粒度的地图集有更多、更小的分割而增加。

本研究有一些局限性: (i)我们使用可用的数据作为一个大的发现样本,最大化了GWAS的统计能力,但这不允许进行发现-复制设计。尽管如此,最终,在最大的可用样本中进行的总联合分析是最具代表性的可用关联证据。如本节前面所述,各种富集分析表明了GWAS研究结果的生物学有效性。有人认为,在当前的生物样本库规模的基因研究时代,发现-复制设计的实用性比以前要低,而且其他形式的验证方法,如生物富集,在解释中应该给予更大的权重。(ii)这是一项大规模的观察性绘图研究,这意味着许多分析都是基于屏幕和描述性的。科学通过观察和假设检验的结合进行——这项研究在不同程度上结合了两者。一些生物学观察是值得注意的和信息丰富的,例如,小胶质细胞和星形胶质细胞可能参与在胚胎和胎儿发育期间影响白质束,现在应该在动物模型中进行更广泛的研究。(iii)这项研究没有考虑到罕见的遗传变异(种群频率低于1%)。未来对英国生物样本库中与白质连接相关的外显子组和基因组序列数据的分析,可能会揭示更多的基因,并提出影响个体间变异的其他机制、细胞类型和寿命阶段。

总之,我们使用大规模分析绘制了人类脑白质连接,其多变量遗传结构,以及它与脑相关疾病和行为特征的多基因倾向的关联。这些分析涉及到特定的基因组位点、基因、通路、细胞类型、发育阶段、大脑区域、纤维束和认知功能,从而整合了多个层次的分析,并在这些水平上提出了一系列未来的研究方向。

5. 材料和方法

5.1 样本质量控制

本研究是在英国生物样本库申请16066下进行的,与C.F.作为首席研究员。英国生物样本库获得了国家研究伦理服务委员会西北地区的伦理批准,所有程序都按照世界医学协会指南进行。所有登记的参与者均提供了书面的知情同意书。我们使用了2020年2月发布的dMRI(弥散MRI)数据,以及全基因组基因分型阵列数据。个人可用dMRI和基因型数据,我们首先排除被试不匹配的自我报告和基因推断性,与假定的性染色体非整倍体,或异常值根据杂合度(主成分校正杂合度> 0.19)和基因型缺失(缺失率> 0.05)由Bycroft等人计算。为了确保高度的遗传同质性,分析仅限于具有英国白人血统的被试,这是由Bycroft等人定义的,使用基于捕获遗传血统的前六个主成分的自我报告和聚类分析相结合。根据Bycroft等人的计算,亲属系数为>0.0442。所有这些指标都可在英国生物样本库的数据类别263或100313中获得。我们的纳入程序最终得到30,810名被试,平均年龄63.84岁(范围45-81岁),14636名男性,16174名女性。

5.2 基因质量控制

我们从英国生物样本库下载了输入的SNP和插入/删除基因型数据(即2018年3月发布的v3输入数据;英国生物样本库数据类别263和数据字段22828)。采用QCTOOL(v.2.0.6)和PLINK v2.0(105)进行基因型质量控制。具体来说,我们排除了变异小等位基因频率<1%,哈迪温伯格平衡测试P < 1×10−7,和归因信息得分<0.7,其次是删除多等位基因变异不能处理许多程序用于基因相关分析。该管道最后产生了9803735个双等位基因变异。

5.3 弥散核磁共振示踪

弥散MRI数据来自西门子Skyra 3 T扫描仪,采用标准的西门子32通道射频接收磁头线圈。我们下载了由英国生物样本库脑成像团队进行预处理的质量控制的dMRI数据(英国生物样本库数据字段 20250)。预处理管道包括对涡流、头部运动、异常值切片和梯度失真的校正。我们没有使用英国生物样本库团队发布的成像衍生表型,如FA(分数各向异性)和平均扩散率(微观结构测量)。相反,我们使用质量控制的dMRI数据在每个个体的体积空间中进行纤维束造影,从而生成了表征白质纤维束的三维曲线。简单地说,用弥散张量进行建模,在原生扩散空间中生成FA图像,并使用MRtrix3进行确定性扩散张量束造影。流线被播种在一个0.5毫米的网格上,FA为0.15,并使用四阶龙格-库塔积分以0.5毫米的步骤传播。如果流线长度为<20或>250 mm,如果它转向>45°,或达到FA为<0.15的体素,则终止肌束造影。这些参数与之前使用英国生物样本库数据集探索认知表现的结构性网络相关性的研究相一致。在自动解剖标记图谱的基础上,生成了数万条流线来重建每个个体的白质连接矩阵,该图谱共包含包含皮层和皮层下结构的90个区域(每个半球45个区域)。这个在6个并行运行的集群服务器节点上,确定性束生成过程大约花费了16周。

从流线数据中,我们使用MRtrix3工具箱中的“tck2连接体”函数的“scale_长度”选项,计算了由确定性束状图重建的所有区域间连接的平均长度。

5.4 网络建设与分析

描述每个被试的结构网络需要定义网络节点和边。在本研究中,网络节点对应于自动解剖标记图谱的90个区域,该图谱是一种基于三维体积的分割方案。该标记系统集成了来自脑沟和脑回几何形状的详细解剖特征,减少了来自不同个体的大脑图像的空间配准和归一化可能产生的解剖变异性。对于每个被试,T1图像(英国生物样本库数据字段 20252)被非线性转换为MNI(蒙特利尔神经学研究所)空间中的ICBM152 T1模板,以生成转换矩阵。使用逆变换将自动解剖标记图谱从MNI体积空间扭曲到原生体积空间。使用最近邻插值方法保留离散标记值。如果两个节点被至少一个重建流线的终点连接,则认为它们是连接的。另外,对于数据集中的每个个体,网络边缘是通过连接给定一对区域的流线数量除以两个区域的体积来计算的,因为体积较大的区域有更多的流线连接到它们。这是白质网络研究中的一种常见的方法。我们只包括了在至少80%的被试中检测到的边缘,这从我们的研究中删除了3058个弱的或虚假的连接。这为每个被试产生了一个零对角对称的90×90无向连接矩阵,其中保留了947条边。然后将一个区域的节点水平连接定义为该节点与网络中所有其他节点之间所有现有体积加权边的和,反映该节点在整个网络中的总连接。

对每个网络测量进行基于秩的逆归一化,并对年龄(英国生物样本库字段21003)、非线性年龄(即(年龄平均年龄)2)、评估中心(英国生物样本库数据字段54)、基因型测量批次(数据字段22000)和性别(数据字段31)进行回归。然后进一步回归捕获群体遗传多样性的前10个遗传主成分(英国生物样本库领域22009),然后再次对残差进行基于秩的逆归一化,并对其分布进行目测以确定正态性。标准化的、转化的措施被用于后续的遗传分析。

5.5 基于SNP的遗传力

我们利用常染色体上的9,516,306个变异,其等位基因频率为>1%,信息得分为>0.7,哈代-温伯格平衡P > 1×10−7,使用GCTA(版本1.93.0beta)。我们进一步从每对被试中排除了一个亲属系数大于0.025的随机被试(因为基于SNP的遗传力分析对亲缘水平较高的参与者特别敏感),得到了29,027名被试。然后进行基于基因组的限制性最大似然分析,以估计每个标准化结构网络测量的基于SNP的遗传力,再次使用GCTA。对每种类型的网络测量分别应用Bonferroni校正,以确定那些在调整后的P < 0.05:90节点水平连接和851边缘水平连接下显著遗传的网络测量。

5.6 可遗传网络测量的可靠性

对于我们对30,810名患者(以上)的主要分析,我们使用了来自英国生物样本库评估中心的第一次扫描访问的数据。其中1005人在第一次扫描后的733-974天的不同时间里也进行了脑部扫描(T1结构和DTI)。为了检验显著遗传性大脑网络测量的可靠性,我们对这1005个个体的“第二次扫描”数据重新运行了确定性束造影,使用与主要分析相同的参数和质量过滤器,并重新计算了与主要分析相同的边缘连接指标。然后,对与主分析相同的协变量进行线性调整,并像主分析一样采用基于秩的逆归一化。然后使用来自第一次和第二次扫描的调整后的归一化值来计算每个可遗传网络度量的ICC,以评估可靠性。ICC的计算公式如下:

图片
图片

其中,BMS表示个体间的均方,WMS表示个体内的均方,m表示重复测量的次数(这里,m = 2)。

5.7 多变量全基因组关联分析

mvGWAS分析共采用9803735个双等位变异,跨越所有常染色体和x染色体。mvGWAS的样本量为30810个。我们应用MOSTest工具箱对显著遗传措施进行mvGWAS分析,分别用于节点水平连接和边缘水平连接。MOSTest可以利用遗传影响在数百种空间分布的大脑表型中的分布性质,同时解释它们的协方差,这可以提高检测变异-表型关联的统计能力。具体来说,多元相关结构是由随机排列的基因型数据来确定的。MOSTest将马氏范数计算为单变量GWAS汇总统计量的去相关z值的平方和,将跨度量的影响整合到每个遗传变异的多变量z统计量中,并使用伽马累积密度函数来拟合零分布的解析形式。这允许在P = 5×10−8显著性阈值下推断零分布,而不进行不可行的排列数(5×10−8是欧洲血统人群中GWAS多重检验校正的阈值)。对排列和分析形式的零P值分布的密切匹配表明,该方法正确地控制了第1类错误;我们的所有四种mvGWAS分析都是这样。在这个框架中,单变量z分数的符号(正或负)表示相应的影响方向(相对于增加的数量在给定SNP上的最小等位基因频率) 而多变量z分数总是正的。

5.8 基因组位点的鉴定,功能注释和SNP-基因的定位

我们使用FUMA(版本v1.4.0)来识别不同的基因组位点,这些位点与大脑结构连接和应用功能注释显著相关,使用默认参数。LD结构根据1000个基因组欧洲参考面板进行应用。具有全基因组显著mvGWAS P < 2.5×10−8的SNP,其LD r 2 <为0.6。对于这些SNPs,其他具有r2≥0.6的SNPs被纳入进一步注释,独立的“先导SNPs”也被定义为与其他的具有低LD(r2 < 0.1)。如果显著SNP的LD块彼此位于250 kb范围内,则将它们合并为一个基因组位点。因此,一些基因组位点可能包含一个或多个独立的先导SNP。6号染色体上的主要组织相容性复合体区域被默认排除在这一过程之外,因为其特别复杂和长期的LD结构。根据先前发表的标准,在FUMA中进行了功能注释和SNP-基因定位。

5.9 独立相关的先导SNP的多变量关联谱

对于每个SNP,MOSTest为每个大脑测量获得一个z分数,根据该SNP与每个个体测量的单变量关联的P值计算出来。z分数表明了哪些测量方法对给定SNP的多变量关联的贡献最大。我们使用来自纤维束mvGWAS的z分数来识别与一组六个左半球语言相关的纤维束中至少一个显著相关的先导SNP。确定意义在这种背景下,阈值z分数的无符号大小大于3.56,对应的P值为2.37×10−4(即P < 0.05后校正所有211个单核苷酸多态性的mvGWAS的纤维束和考虑六个纤维束)。为了确定哪些结构连接性度量对领先SNPs之间的多变量关联贡献最大,我们分别对所有领先SNPs之间的每个度量的无符号单变量z分数进行了总结。

5.10 基于基因的关联分析

MAGMA(v1.08),默认参数在FUMA(SNP均值模型)中实现,用于检测给定基因内所有SNP(包括上游50kb到下游50kb)产生的联合关联,同时考虑SNPs之间的LD。根据美国国家生物技术信息中心建立的37.3个基因定义,将SNP定位到20,146个蛋白质编码基因上,每个基因至少有一个SNP代表。对每个mvGWAS的基因数(P < 0.025/20,146)分别采用Bonferroni校正。

5.11 基因集富集分析

MAGMA(v1.08),采用在FUMA中实现的默认设置,用于检查预定义基因集之间的关联富集。这一过程测试了所有20146个基因的P值在预定义功能集内的基因中是否低于基因组中的其他基因,同时校正其他基因属性,如SNPs的数量。从MSigDB数据库7.0中检测15488个基因集[5500个筛选基因集,7343个基因本体(GO)生物过程,1644个GO分子功能和1001个GO细胞成分]。采用Bonferroni校正方法,分别对每个mvGWAS的基因集数量(P < 0.05/15,488)进行校正。

5.12 人类皮层发育过程中的细胞类型特异性表达分析

在线性回归模型的基础上,细胞类型函数FUMA测试基于基因的关联z分数是否与更高的表达水平,基于单细胞RNA测序数据的人类前额叶皮层(GSE104276)。该数据集包括(i)每个年龄组的每个细胞类型的表达,从怀孕后8周到26周,(ii)每个细胞类型的表达谱,所有年龄的平均值。如果相关性P值小于细胞类型/年龄组数量的相关Bonferroni阈值,则认为结果是显著的。对每个mvGWAS分别进行分析。

5.13 发育阶段分析

我们使用MAGMA(默认设置实现FUMA)来检查是否低基因关联P值倾向于发现基因表达相对较高的大脑跨度基因表达数据从任何特定的寿命阶段与所有其他阶段相比,分别为29个不同年龄组从8怀孕后周到40岁,和11定义寿命阶段从产前早期到成年中期。每次分析分别采用错误发现率阈值为0.05。该测试的正β系数表明,显示出更多关联证据的基因在特定的寿命阶段平均相对上调。大脑研究最初收集和分配人类大脑死后组织样本的发展/寿命阶段,但FUMA实现排除两个年龄组不到三个样本(即25周和35周),导致29个年龄段被FUMA指定的分析。

5.14 对脑相关疾病或行为特征的多基因倾向

我们使用PRS-CS计算多基因分数30810英国生物库个体的以下脑相关疾病或行为特征,使用GWAS总结统计从先前发表,大规模研究:精神分裂症(n=82315),双相情感障碍(n=51710),自闭症(n=46350),注意缺陷/多动障碍(n = 55,374),左利手(n=306377),阿尔茨海默病(n=63926),肌萎缩性侧索硬化症(n=152268)和癫痫(n=44889)。之前的研究中,没有使用左撇子的GWAS数据;然而,GWAS中的个体被选择为不重叠的,与那些拥有2020年2月数据发布的大脑图像数据的人无关,因此本研究中的30,810名英国生物样本库个体中没有一个被纳入该GWAS。这确保了多基因评分计算的训练和目标集是独立的。PRS-CS在高维贝叶斯回归框架内,基于全基因组关联汇总统计,推断常染色体SNPs的后验效应大小。我们使用了默认参数和推荐的全局效应大小收缩参数ϕ= 0.01,以及基于1000个基因组项目第三阶段欧洲血统参考面板的LD信息。多基因得分计算使用1097390个SNPs精神分裂症,1098372个SNPs双相情感障碍,1092080个SNPs自闭症,1042054个SNPs注意缺陷/多动障碍,1103632个SNPs,1105067个SNPs阿尔茨海默病,1085071个SNPs肌萎缩性侧索硬化症,和852343个SNPs癫痫(这些数字来自英国生物库之间的三个重叠数据,GWAS结果,和1000个基因组数据)。PRS-CS已被证明与其他已建立的多基因风险算法高度相似,比基于P值阈值和LD聚类的方法具有明显更好的样本外预测。

多基因得分根据年龄、非线性年龄[即(年龄-平均年龄)、评估中心、基因型测量批次、性别、以及捕获群体遗传多样性的前10个遗传主成分的影响进行线性调整,然后进行基于秩的逆归一化(即调整大脑指标的同一组协变量效应)和目视检查其分布以确认正态性。调整后的和归一化的多基因评分作为后续分析的输入。

另外,对于每种疾病或行为特征的多基因得分,使用30810名被试的典型相关分析(MATLAB中的“规范”函数)来测试与90个遗传节点水平连接测量的多变量关联。该多变量分析确定了90个节点水平连接度量(即典型变量)的线性组合,这些指标最大限度地与参与者的特定障碍或行为特征的多基因得分相关。另外,对于每个疾病或行为特征的多基因得分,每个节点水平连接和典型变量之间的交叉参与者皮尔逊相关性被用作加载,反映了节点水平连接对特定多变量关联的贡献的程度和方向。我们还评估了不同疾病和行为特征的调整和标准化多基因得分之间的个体之间的两两相关性。

APOE位点对阿尔茨海默病的风险有重大影响,我们也重新计算多基因得分后排除一个地区19:45,11691119:46318605(GRCh37)在这个位点和重复残差、标准化和规范相关分析检查结果稳定反映了多基因对风险的贡献。

5.15 与多基因评分最密切相关的脑区功能注释

从多基因评分和节点水平连接的每个单独的典型相关分析中,我们确定了显示>0.2或<−0.2负荷的区域,然后使用这些区域来定义标准脑空间中的单个掩码(蒙特利尔神经学研究所空间152)(即每个多基因评分有一个掩码)。每个掩模都使用神经合成器数据库(http://neurosynth.org)的“解码器”功能进行分析,这是一个用于大规模功能MRI数据合成的平台。该数据库使用元分析的功能激活图,定义了与特定的认知或行为任务术语相对应的全脑激活图。该数据库包括来自14371项研究的1334张特定激活术语图。我们创建的每个面具都被分别用作输入,以定义一个基于数据库中所有研究的全脑共激活图。然后将得到的共激活图与1334个术语特异性激活图相关联。我们只报告相关系数r > 0.2的术语,而排除了解剖术语、非特定术语(例如,“任务”),以及每对几乎重复的术语(如“Words”和“Word”)中的一个。这种方法不使用推理统计检验,而是根据它们的激活映射和输入掩码之间的相关性对术语进行排序。

参考文献:Genetic architecture of the white matter connectome of the human brain.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  •  1. 摘要
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档