前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ASI 8年计划 paper8 自由能原理建模生物神经形态发生

ASI 8年计划 paper8 自由能原理建模生物神经形态发生

作者头像
CreateAMind
发布2024-02-26 17:14:01
930
发布2024-02-26 17:14:01
举报
文章被收录于专栏:CreateAMindCreateAMind

https://royalsocietypublishing.org/doi/full/10.1098/rsif.2014.1383

了解生物体在胚胎发生和再生过程中如何形成其形态代表了生物模式形成方面的主要知识空白。最近有人提出,形态发生可以从细胞信息处理和细胞群塑造形状的能力来理解。在这里,我们提供了一个原理证明,即自组装是细胞的一种新兴特性,它们具有共同的(遗传和表观遗传)生物体形式模型。这种行为是根据变分自由能最小化来表述的 这种行为已被用来解释神经科学中的行为和感知。简而言之,将热力学自由能的最小化转化为变分自由能,可以让人们将系统(的动力学)解释为推断其输入的原因,并采取行动解决这些原因的不确定性。这种关于细胞迁移和分化协调的新视角表明,将遗传密码解释为参数化生成模型(预测目标形态中细胞感知的信号),并将表观遗传过程解释为该模型的后续反转。这种理论表述可以补充自下而上的策略(目前专注于分子途径)和(建构主义)自上而下的方法,这些方法已经在神经科学和控制论中证明了自己。

学科领域:生物复杂性、系统生物学、生物数学

关键词:主动推理,形态发生,自组装,模式形成,自由能,随机吸引子

1. Introduction简介

生物学的核心问题之一是形状的起源和控制[1‑3]在胚胎发生过程中,细胞如何合作构建高度复杂的三维结构?如何利用自我限制的生长和重塑来促进蝾螈等动物的四肢、眼睛和大脑的再生[4]?了解如何诱导大规模形状的特定变化(不仅是基因表达或细胞分化)对于基础发育和进化生物学至关重要,也是再生医学和合成生物工程取得根本性进展的基本要求[5‑9]。

尽管我们现在对模式化所需的分子成分了解很多[3,10–12],但目前尚不清楚系统的大分子和细胞成分如何协调自身以产生特定的结构和功能[12–16] ]。重要的是,尽管存在剧烈的外部扰动,许多生物体仍能够将其模式重新调整为特定的目标形态,并且在达到正确的形状时能够停止生长和重塑[17‑19]。目前尚不清楚细胞行为如何协调以达到正确的大规模形态,以及当正确的结构完成时系统如何能够停止。很少有建构主义模型能够表明什么动力学足以产生复杂的模式并进行重构,直到得到目标解剖结果。目前对特定蛋白质途径的关注造成了知识差距:高分辨率遗传数据通常无法指定可能或将要发生的大规模形状或该形状的变形。一个重要的推论是,很难知道必须如何或调整无数低级成分(基因或蛋白质)中的哪些才能获得特定的模式变化[16]。

这阻碍了出生缺陷和再生医学的进展,这些医学领域试图诱导形成大小、形状和方向正确的有序器官,而不仅仅是基因活动模式或干细胞分化。与几乎完全追求自下而上策略相反,最近提出了一种互补的方法。可能顶层模型能够简明地解释高级现象,例如细胞行为朝着特定的拓扑排列协调,并且能够提供利用发育模块化和多潜能性实现大规模形状变化的策略。尽管目标导向模型在控制论、物理学和认知神经科学中取得了成功,但这些原则性方法尚未应用于形态发生学。在这里,我们探讨了这些思想的一个具体应用,通过优化原则对形态发生进行建模。

在本文中,我们追求了一种观念,即形态发生的自组织需要每个细胞都对其在最终形态中的位置有一种隐含模型,并且自组装是根据该模型预测的本地信号移动的过程。换句话说,我们考虑了细胞如何实现目标形态的反问题的生物学合理解决方案,这是基于它们在达到该形态后应该感知的信号的前向或生成模型。简言之,我们将解决方案形式化为极值或最优性原则;即自由能的最小化。这种最小化是许多层面上自组织的固有特性。例如,蛋白质折叠可以最小化热力学自由能。然而,我们考虑到了一点关于自由能最小化的特殊之处:通过将热力学自由能的最小化重写为信息论中的变分自由能,可以解释自组织具有贝叶斯意义。实际上,最小化变分自由能等价于最大化系统通过采样信号(数据)所包含的模型的(贝叶斯)证据。这使得我们可以从推理和概率信念的角度来谈论自组织,这些信念隐含在系统与其局部环境交换中。这一观点基于神经科学中长期以来的理论工作,试图将行动和知觉以意识和无意识推理的术语来表述。近年来,随之而来的变分自由能原则已被应用于细胞和前生物自组织中:其中环境向系统的内部状态提供(感觉)信号,反过来,这些信号又影响对环境的行动。内部状态和主动状态的变化都最小化了变分自由能,分别导致贝叶斯最优的感知和行动。这被称为主动推理。

在这里,我们探讨了相同的原则是否可以解释形态发生中的自组装过程。这是一个特别困难的问题,因为与通用的模式形成不同,形态发生意味着一个预先确定的图案或形态,所有细胞都应该趋于收敛。然而,从任何一个细胞的角度来看,其余的细胞构成了只能通过细胞间信号传递来推断的外部或环境状态;分子或电化学[44]。这意味着每个细胞只能在所有细胞都到达目标位置并释放适当的(化趋性)信号时,才能推断出其在目标形态中的位置。这提出了一个困难的先有后有(反向)问题,需要每个细胞与其他所有细胞区分开来,以便它能释放出使其他细胞区分自己的信号解决这个自组装的难题的一个方法是假设每个(未分化的)细胞都具有细胞群的相同模型,它用于预测它应该在目标形态的每个位置遇到的信号在形态发生的开始阶段,所有细胞都是相同的:它们具有相同的模型和隐含的(干细胞样)多能性,并且对其过去的位置或最终命运一无所知。然后,如果每个细胞都最小化变分自由能,那么它原则上应该能够推断出自己在细胞群中的独特位置,并相应地行为。这是有保证的,因为当每个细胞处于唯一位置并正确推断其位置时,变分自由能的最小值被获得。在这一点上,它将表达适当的信号并实现所有其他细胞的预测;从而最大化其对细胞群模型的证据(并最小化细胞群的自由能)。这种行为可以被视为自主的、自我构建的或“自我生成”的意义上的Maturana & Varela [45]。实际上,从许多方面来看,主动推理可以被看作是自我生成的形式化。接下来,我们展示了一些简单的细胞迁移和分化的模拟,以证明自组装可以用这些术语来理解。结果动态描绘了一个相对简单的图景,其中每个细胞模型的参数都是通过基因编码的——告诉每个细胞它应该如何行为(它应该表达什么),如果它知道自己在细胞群中的位置。然后,可以将细胞内信号转导——作为信号受体激活的反应——与推断其位置或身份联系起来。然后,这种推断导致适当分子信号的转录和释放,这些信号诱导其他细胞内信号的转导。这(信号依赖的)转录可以是表观遗传过程的隐喻。我们首先简要回顾了(热力学)自由能最小化在耦合的(随机动态)系统中的基础,以及如何将其表述为主动(贝叶斯)推理。然后,我们使用这个形式化方法来模拟一个简单生物体(具有头部、身体和尾部)的形态发生,以说明 emergent 行为。最后,我们模拟一些实验性的干扰,以说明预期的再生和畸形发生的后果。

2. Generalized dynamics 广义动力学

我们将考虑由以下形式的随机微分方程描述的(弱混合遍历)随机动力系统中的自组装:

。。实质上,这些方程指定了在广义运动坐标路径上的概率分布。现在我们可以使用 Helmoltz 分解(也称为向量微积分的基本定理)来用无散部分和在标量拉格朗日函数 L(~x) 或李亚普诺夫函数上的无旋下降来表示流动:

图1. 马尔可夫毯和主动推理。本示意图说明了将状态分为内部状态和隐藏或外部状态的划分,这些状态由一个马尔可夫毯分隔开来,包括感觉和行动状态。内部状态可以与细胞的细胞内状态相关联,而感觉状态则成为覆盖在活动状态上的细胞膜表面状态(例如,细胞骨架的肌动蛋白丝)。随后的内部状态自组织对应于感知,而行动将内部状态耦合回外部状态。有关变量定义,请参见表1。(彩色在线版本。)

简而言之,任何(弱混合遍历)随机动力系统都可以被制定为其轨迹的对数似然性的广义上升。然而,这种表述并没有将自组织系统的状态与其局部环境的状态区分开来。要做到这一点,我们必须考虑系统的状态如何与其环境(例如热浴)分离。这涉及到马尔可夫毯的概念。

3. Generalized dynamics and active inference 广义动力学和主动推理

马尔可夫毯是在统计意义上将两个其他集合分开的一组状态。这个术语是在贝叶斯网络或图[50]的背景下引入的,指的是一个集合的子节点(受到影响的状态集合)、其父节点(影响它的状态集合)以及其子节点的其他父节点。马尔可夫毯引导状态分为内部状态和外部状态,后者被马尔可夫毯隔离(隐藏)在内部状态之外。例如,细胞表面可以构成一个马尔可夫毯,将细胞内(内部)和细胞外(外部)状态分开[43,51]。从统计角度来看,外部状态只能通过马尔可夫毯间接地被内部状态看到。马尔可夫毯本身可以被分成两组,一组是外部状态的子节点,另一组则不是。我们将分别将它们称为表面或感知状态和作用器或主动状态。简而言之,马尔可夫毯 S X A 的存在意味着状态被分为外部、感知、主动和内部状态:

外部状态引起感知状态,后者影响但不受内部状态影响,而内部状态引起主动状态,后者影响但不受外部状态影响。关键是,马尔可夫毯引导的依赖关系产生了一种类似行动-感知循环(图1)的循环因果关系。

现在我们可以考虑马尔可夫毯暗示的状态之间的依赖关系,从它们的运动方程角度来看。特别是,我们对构成系统对感知信号响应的内部和主动状态的流动感兴趣:

有关详细信息,请参阅[43]。这个方程式是方程(2.2)关于内部状态和主动状态的类比。它表示它们的流动在内部状态及其马尔可夫毯上的边际遍历密度m上执行广义梯度上升。这意味着我们可以用系统状态的拉格朗日来描述(开放)系统,我们将其与热力学自由能相关联——在非平衡稳态的随机热力学设置中[52]。

在这一点上,我们可以停下来,简单地惊叹于进化选择了具有吸引子的运动方程,这些吸引子在生物系统中具有复杂的形式(例如蛋白质折叠、形态发生和pattern形成)。这些吸引形式在热力学自由能的概率描述中被描述为系统内部状态和马尔可夫毯上的概率。虽然我们知道这个拉格朗日存在,但实际上(几乎)不可能评估其形式。然而,有一种替代的方程(3.1)的表述,允许用系统认为应该如何行为的概率模型来描述流动。这个表述基于以下引理:

证明详见【43】。这个引理说,如果一个人把内部状态解释为参数化关于外部状态的一些任意(变分)密度或贝叶斯信念

关于外部状态,那么内部和活动状态的动力学可以被描述变分自由能的梯度下降。重要的是,这种自由能是构成系统的状态的函数;即内部状态及其马尔科夫毯。 【53】。这也是在近似贝叶斯推断中广泛使用的对数模型证据的自由能界限;例如,变分贝叶斯和集成学习【54–56】。

上述的变分自由能表达式强调了它的贝叶斯解释:第一个等式将自由能表示为预期的拉格朗日(吉布斯能量)减去变化密度的熵。第二个等式表明,变分自由能是热力学自由能加上相对熵或外态上变分密度和后验密度之间的kull back–lei bler散度【57】。方程(3.2)的解意味着内部状态使自由能最小化,使得散度为零(通过吉布斯不等式)。这意味着变分自由能变成热力学自由能,而变化的密度成为后验密度。在这种情况下,热力学自由能也被称为对数边际可能性或对数模型证据。简而言之,内部状态将似乎参与贝叶斯推理,有效地推断感觉状态的(外部)原因。此外,活动状态也参与了这一推论,对最大化模型证据的感觉状态进行采样:换句话说,选择系统预期的感觉。这是一种主动推理,在这种推理中,内部状态和行为在某种程度上最小化了自由能,或者最大化了模型证据这与良好调节器定理和自组织的相关处理方法一致【49,58–61】。

上述变分公式直接涉及到控制论创世之初的两个基本观察:即每个良好的调节器都是其环境的模型,以及必要多样性法则[58,62]。第一个观察得到了证实,因为变分自由能是关于感官状态如何由外部状态生成的概率模型的一个函数。必要多样性法则源于这样一个事实:变分密度必须由其基数等于或超过后验密度的足够统计量的内部状态编码。这是为了消除变分和后验密度之间的差异。关于基于信息的控制系统的最优性标准的相关讨论,请参阅[63]。良好调节器定理提供的视角突显了(开放的)系统可以成为其环境的创作者这一事实。换句话说,它可以通过行动控制外部或隐藏状态,使它们满足生成模型的预测。事实上,正如我们将在后面看到的,生成模型的隐藏状态甚至不需要存在——只要它们的感觉后果可以通过行动进行调节。这一点很重要,因为它允许人们根据生成模型来指定热力学自由能,从而确定吸引状态集合(例如目标形态)可以具有相当复杂的形式。

有了这个(主动推理)公式,我们现在可以通过整合方程(3.2)来模拟自我组装,给出一个(概率生成)模型,该模型需要关于其环境的信念。换句话说,我们只需要将生成模型

和环境动力学

指定为完全为系统及其环境指定必要的运动方程。通常,该模型是根据具有加性噪声的非线性映射来指定的:

对于随机波动

,高斯假设(由它们的精度或逆方差参数化)规定了关于外部状态的似然性和先验,这些外部状态定义了拉格朗日或生成模型。

其中P(I)对应于随机波动的精度或逆方差。在下文中,我们使用spm学术免费软件中的Matlab例程spm_ADEM.m对方程(3.2)进行积分。1该方案使用拉普拉斯假设

,并在广义运动

内关联无发散流,结果方案可以是被视为一种广义贝叶斯滤波器,其中内部状态成为外部或隐藏状态的期望值,详见【64】。这个计划已经在几篇论文中用于模拟神经科学中的主动推理。在接下来的内容中,我们用它来模拟自我组装——以及这是如何阐明遗传学的作用的和形态发生中的表观遗传学。这些模拟被提供作为上述方案为(简单的)自组装提供了充分解释的原理证明。

4. Simulating self-assembly模拟自组装

我们模拟了形态发生过程,根据图2中指定的目标形态,该形态以八个克隆细胞的位置和分化来描述(一个具有头部、身体和尾部的简单形式)。在这里,我们专注于每个克隆在随后增殖之前的迁移和分化(图2的右上方面板中填充的细胞)。我们有意将问题简化到其最基本的要素,以展示动态的本质,这将在最后一部分中用于预测各种干预结果。简言之,从一组未分化细胞开始,我们希望使用自由能的最小化来模拟它们的迁移和分化。为简单起见,我们没有考虑细胞分裂;然而,随后的行为显示出了明显的迁移和分化阶段,这些阶段完全由细胞外信号介导:例如,趋化信号或缓慢的电化学耦合。至关重要的是,在形态发生的开始阶段,所有细胞都是相同的:虽然它们都具有相同的模型和内在(干细胞样)多能性,但它们对自己的位置或最终命运一无所知。

图2. 目标形态。右侧面板显示了目标位置的编码(左上方)和细胞类型(左下方)。这种编码可以被视为指定每个细胞所表达的化趋信号的基因密码,与特定的—可能是位置编码的—位置相关联。换句话说,编码的细胞内位置可以编码外部位置,如示意图所示(中间面板),将信号表达与二进制密码相关联。相应的配置显示在右上方面板中,其中最后三个信号表达用于区分细胞(使用红-绿-蓝的颜色方案)。八个克隆的位置用填充的星号表示。右下方面板显示了在此目标配置下在每个位置处感知到的目标浓度。(彩色在线版本。)

结果自组装的一个关键方面是循环因果关系,这源于对多个细胞进行建模,其中每个细胞由内部(细胞内)状态及其马尔可夫毯构成。马尔可夫毯的感觉状态仅限于外源(细胞外)和内源(细胞内)浓度的趋化受体样本,而主动状态可以引起细胞迁移(在二维表面上)或趋化信号的释放。这是一个有趣的设置,因为一个细胞的外部状态是其他细胞的主动状态。这意味着我们实际上在模拟一个多系统或多代理问题,必然涉及细胞之间某种形式的通信或广义同步

通过将自组装框架化为主动推断,我们现在可以从以下方式功能性地讨论细胞的信念和行为:每个细胞都拥有一个生成模型,该模型编码了关于化趋化信号的(遗传)信念,即如果细胞位于目标形式中的特定位置,则应该感知和表达的信号。但是,它必须首先推断其身份,以趋化信号为基础,从而预测应该感知和表达的信号。然后,通过移动浓度梯度来满足细胞外预测,并释放信号以匹配细胞内预测,行动可以实现这些预测。显然,如果所有其他细胞都位于其目标位置并且正在表达适当的信号,那么这将是一个相当健壮(且平凡)的方案;然而,在形态发生的开始阶段,它们并不是。这就是循环因果关系的所在。为了达到目标形式,每个细胞必须根据化趋化浓度梯度移动到适当的位置。然而,这些梯度取决于细胞迁移换句话说,自组装要求每个细胞“知道自己的位置”,以便群体可以建立一个化趋化参考框架,使每个细胞“知道自己的位置”。这就是通过最小化自由能解决的问题,当且仅当每个细胞与唯一的目标位置关联时,自由能被最小化。请注意,分化后,每个细胞都必须推断出一个独特的身份,而无需访问其他细胞的信念。这个困难的问题通过主动推断的具体性质来解决:因为一个细胞一次只能处于一个位置,所以存在一个独特的自由能最小值,每个细胞都知道自己的相应位置。虽然这可能听起来抽象,但相对来说,模拟自组装并将形态发生解释为熟悉的过程(如基因途径、表观遗传影响以及生物物理或化学指导信号)是相对简单的。

详细来说,我们模拟了非常简单的环境动态,外部状态包括每个细胞的位置

及其释放的四种趋化信号

这些信号是每个细胞的相应活跃状态。更现实的模拟将模拟细胞迁移和信号作为动作的函数;但是,我们将假设动作足够快,可以使用绝热近似

即解

感觉状态对应于细胞内、外源性和细胞外信号的趋化浓度。在这里,我们假设存在外源性(线性)浓度梯度,稍后我们将放松这个假设。

其中,

表示发育时间,并模拟对细胞外信号的敏感性线性增加(例如,随时间逐渐表达细胞表面受体)。最后,假定每个细胞具有相同的生成模型,该模型以从隐藏状态到感知的映射来指定。

其中,矩阵

分别对应目标位置和在这些位置上表达的四种信号的组合。隐藏状态

的(softmax)函数返回关于每个细胞身份的期望。这些期望使细胞能够预测它应该表达和感知哪些趋化信号。我们假设隐藏状态具有(零均值)高斯先验,其精度为P(2)(对数精度为负二)。这意味着细胞具有先验信念,即它们高度期望成为特定的克隆,但它们不知道它们属于哪个克隆。这种形式的先验在稀疏因果生成模型中是普遍存在的(例如,[65])。由此产生的模型非常简单,没有层次结构,使我们能够放弃方程(3.2)的上标。

这个生成模型或拉格朗日产生了内部和外部状态的非常简单的动态(抑制高阶项并使用

其中,

是在趋化信号受体水平的预测误差,其梯度为

信号精度P(1)的对数精度为二,而模拟的(广义)运动的精度则采用了具有单位高斯自相关函数的随机波动模型。这些方程有一些直接的解释:内部状态组织自己以最小化(加权精度的)基于预测的预测误差。这些预测是由目标位置和浓度的加权混合编码

产生的。如果我们将这种编码与基因密码相关联,那么其转录成预测可以与表观遗传过程(即细胞内信号依赖的转录)相关联。图2使用模拟中假定的目标形态对此进行了图形化说明。在这里,目标形态的不同部分与四种细胞类型相关联,这些细胞类型根据表达的信号组合来定义。

对于行动的更新甚至更简单。活跃状态控制趋化信号和细胞迁移的表达。信号表达简单地试图缩小预测信号和检测到的信号之间的差距,而迁移则由细胞感知到的局部浓度梯度驱动。值得注意的是,这些梯度需要在空间上广泛分布的表面或感觉上皮上存在受体,这是生物的特征。此外,它需要细胞的空间尺度与趋化梯度的关系非平凡;尽管在这个背景下,请参阅[66]讨论主动采样。就启发式而言,细胞移动以满足其对应该遇到的信号的期望,同时表达与其当前关于目标群体中自己位置的信念相关联的信号。

图3. 自组装。该图显示了模拟结果,即通过主动推理暗示的解决方案或轨迹。这个模拟使用了一个局部线性近似来集成自由能的广义下降(方程(4.3)),在32个时间步中使用了图2中八个细胞的目标形态。每个时间步可以被认为是对迁移和分化进行建模,持续几分钟。上面的面板显示了关于细胞身份的期望的时间过程(左侧),中间面板显示了中介迁移和信号表达的相关活跃状态,并显示了生成的轨迹;投影到第一个(垂直)方向上,并使用颜色编码显示分化。这些轨迹逐渐最小化自由能(左下面板),导致期望建立了一个相对唯一的整体分化(下中面板)。该面板显示了每个八个细胞的期望的softmax函数,可以将其解释为每个细胞(列)在整体中占据特定位置(行)的后验信念。列已经重新排序,使得每行中的最大值位于主对角线上。右下方面板显示了使用与图2相同格式的随后配置。在这里,轨迹以小圆圈的形式显示(对于每个时间步)。插图对应于目标配置。(彩色在线版本。)

图3展示了使用图2中所示的目标形态进行的自组装结果。这些模拟使用了32个时间步骤(每个步骤对应几分钟)。结果显示了几个有趣的特征。首先,细胞迅速分散并迁移到它们的目标位置,然后在第八个时间步骤左右分化为相应的细胞类型。这种迁移和分化伴随着自由能的显著降低——因为解向目标配置收敛。请注意,在第一次迭代中细胞过于快速分散时,自由能的初始增加(这在非线性生成模型中经常出现)。这里的自由能是整体的自由能或每个细胞的自由能之和(因为在给定感知信号的情况下,变分和后验密度是条件独立的)。所有细胞都从同一位置开始,并且对其命运有未分化的期望(使用对数精度为负四的小随机期望)。在这个例子中,自组装并不完美,但是复制了总体形态和头部、身体和尾部细胞类型的分化。我们提前终止了模拟,以说明对细胞身份的部分不确定性的解决,这些不确定性由内部状态编码的期望隐含地表现出来。这些期望在图3的中下部面板中显示了所有细胞(在应用了softmax函数后),可以解释为一个混淆矩阵。这个混淆矩阵的非对角块结构显示,正如人们可能期望的那样,头部细胞和身体细胞之间存在轻微的混淆,身体细胞和尾部细胞之间也存在混淆(但是头部细胞和尾部细胞之间没有混淆)。这种混淆在持续分化后解决(未显示结果)。

这些结果说明了一个令人信服的观点,即细胞可以解决关于它们命运的模糊性,即使这种解决取决于其他(同样模糊的)细胞建立的上下文。随后的工作将通过将各种数量与细胞内信号传导和转录相关联,以测试关于各种实验干预结果的具体预测,从而增加这些模型的生物学逼真性。为了说明这种建模的潜力,我们总结了一下对再生和畸形发生的简要模拟,以说明上述简单系统可能表现出的行为特征。

5. Simulating regeneration and dysmorphogenesis模拟再生和畸形发生

真实的生物组织展示了令人称奇的自我修复和动态重配置能力。例如,扁虫再生提供了一个迷人的模型,可用于描述去除身体部分或完全切割后的重配置过程(参见[4]进行了综述);许多物种的早期胚胎同样具有调节性,在完全切割后会完全重塑。为了说明这种行为特征,我们对形态发生进行了八个时间步长的模拟,然后将部分分化的胚胎切成两半。然后,我们通过复制每半部分的细胞(保留它们的位置和部分分化)来模拟细胞分裂,并继续为每个部分单独地集成形态发生方案。

图4的左侧面板显示了八个时间步长内的正常形态发生,而上排显示了后继的32次迭代中原始尾部细胞的发展。这有效地模拟了头部的再生。头部细胞的相互发展可以在下排面板中看到。可以看到,那些最初注定成为尾部和头部细胞的细胞在恢复目标形态之前经历了轻微的去分化。在这个例子中,分裂胚胎的头部需要稍长的时间才能达到最终的形态。这个例子说明了细胞的多潜能性质以及自组装能力从相当 drastic 的干预中恢复的能力。

为了说明畸形发生(例如诱发的先天缺陷),我们重复了上述模拟,同时改变了细胞外信号的影响程度——而不改变生成模型(遗传和表观遗传过程)。图5展示了在改变外源性、细胞内和细胞外信号的水平(或敏感性)时产生的各种异常形态。例如,当对外源梯度的敏感性被抑制时,细胞认为它们迁移不足以分化,并对其身份感到困惑而保持不变。相反,如果我们增加对垂直梯度的敏感性,细胞会在较小的垂直距离上迁移,导致最终形态的垂直压缩。将对细胞内信号的敏感性提高一倍会导致迁移和分化失败以及广泛的萎缩。更有选择性的干预会产生各种目标形态不同部分的畸形发生:减少对第二趋化信号的敏感性——由头部细胞表达——会减小头部的大小。类似地,减少对第三信号的敏感性会导致身体细胞选择性地无法分化。这些模拟并不旨在详尽无遗地描述,而是说明了在进行实验操作(例如,细胞间信号的药理学干预)后可以做出的预测。

6. Conclusion结论

总之,我们介绍了遍历系统的变分(自由能)表述,并通过模拟建立了这种表述可以解释朝向特定模式的简单自组装的原理证明。我们将这一概念框架化为形态发生,将任何自组织系统中隐含的生成模型与遗传和表观遗传过程联系起来。显然,这项工作有许多可以进一步拓展的领域;例如,细胞分裂和肿瘤发生:请参阅[67],以及对形态发生的分子生物学和生物物理学的广泛知识。此外,我们仅考虑了具有固定点吸引子的生成模型。在未来的工作中,将在生成模型中包含运动方程将会很有趣,使得某些细胞类型可以表达快速动态并在分化后产生动态行为(如脉动)。最后,未来的工作应该探索我们在形态发生领域展示的自组织和自我生成动态是否以及如何推广到更大规模的现象,比如大脑和社会,正如一些学者不同地提出的那样[45,68].

图5. 干扰自组装。右上和左上面板显示当自组装受到外源梯度浓度改变的影响时与目标配置的偏差。第一个干预说明了由于对外源信号的非特异性抑制而导致的迁移和分化失败,而有选择性地增加垂直梯度则沿相应方向产生压缩。当减少细胞内(固有:左下面板)和细胞外(外在:右下面板)受体敏感性时,会导致更奇特的畸形发生形式。(彩色在线版本。)

主动推理的前提是基于一种变分自由能,它与物理学中的热力学自由能有所不同。事实上,严格来说,本文中使用的形式主义“建立在”经典物理学之上。这是因为我们只做了一个假设;即世界可以描述为一个随机动力系统。一切都是从这个假设出发的,使用概率论的标准结果。那么,变分自由能与热力学自由能有什么关系呢?如果我们采用统计热力学中假设的模型(例如微观态的正则系),那么变分自由能的最小化应该(也确实)可以解释经典力学(例如,[69,70])。同样地,人们可能希望热力学自由能的推广与远离平衡系统[71]和非平衡稳态(例如,[52,72])有密切关联。这在连接变分和热力学描述中可能是重要的。例如,是否可以将外部状态视为热储库,将内部状态视为受驱动的系统?在受驱动的系统中,通过持续吸收功而后耗散,这种交换过程的可靠性或概率可能可以由变分自由能来衡量,以便在其最小值处形成稳定结构[73]。然而,这类问题仍然是一个悬而未决的挑战。

我们的模拟基于几个简化的假设,比如细胞中编码的内容,目标位置的(位置编码)性质,以及细胞间通信的具体细节。重要的是要注意,这个框架并不明确依赖于这些假设,将模型扩展到包括对基因编码和信号传导更详细和更真实的描述是一个开放性挑战。这些方案的一个潜在激动人心的应用是将它们用作实际数据的观测模型。这将使得可以估计模型参数,并且通过模型比较来识别模型的形式。对于时间序列数据的模型拟合已经建立了一个已有的程序,就像本文中考虑的那种程序一样,这个程序已经被用于神经网络的分析。这被称为动态因果建模[74,75],并且使用了上述的自由能最小化。虽然神经网络和形态发生模型的性质可能看起来不同,但在形式上它们非常相似:神经连接转化为动力学速率常数(例如由上述的精度控制),神经活动转化为各种细胞内和细胞外信号的浓度或表达。原则上,将动态因果建模应用于形态发生的实证测量应该提供一种通过贝叶斯模型比较来测试具体假设的方法,并且以定量和实证的方式来确立上述建模的基础。还应该指出,现在已经清楚,即使非神经细胞也具有许多与神经元相同的离子通道和电突触机制,并且它们将这些机制用于模式形成和修复。这表明神经网络动力学和控制形状确定的生物电信号网络之间可能存在重要的共同点[20,21,83].

本文中的示例使用了一个相当任意的生成模型。例如,选择四个信号在很大程度上是出于审美考虑——与DNA密码子相类比:第一个信号由所有细胞表达,主要与细胞间距有关。其余的三个信号提供了八种组合或不同类型的细胞(尽管我们只展示了四种)。人们也可以问为什么要使用外源梯度的动机。这不是方案的必要组成部分;然而,我们的模拟表明,它为更大的集合(超过四个克隆)提供了更稳健的解决方案。此外,它确保了目标形态的方向是相对于一个外在的参考系来指定的。话虽如此,引入生成模型的分层方面可能是在不同空间尺度上模拟真实形态发生的更为优雅的方式。我们假设每个细胞模型的参数都是基因编码的。另一个有趣的可能性是,在表观遗传和生长过程中,细胞通过选择性地表达固定代码来学习一些模型参数。换句话说,在生长过程中,每个细胞可能会获取(或调整)其生成模型的参数,从而在表观遗传过程中出现目标形态。因此,整个有机体可能表现出自我建模过程——它们本质上是在模拟自己的生长过程。这里有一个有用的类比是自我建模的机器人,它们学习了自己结构的模型(例如,它们的身体形态),并使用这些模型来预测运动的感觉后果——并保持其完整性或从损伤中恢复[84]。在计算神经科学和机器学习中,已经提出了各种各样的方法来进行这种形式的(结构)学习[85]。从技术上讲,学习和推理之间的区别涉及到对参数和期望状态进行优化,以便与模型证据(即自由能)相关联。在本文中,我们专注于推断(隐藏)状态,而不是参数(如对数精度)。可以总结说,尽管目标形态的某些方面是遗传编码的(在生成模型的参数中);表观遗传过程(主动推理)对于形成patterning是不可或缺的。事实上,一些物种的再生目标形态是可以永久改变的;例如,通过对电突触进行简短的修改可以创造出永久的两头扁虫[44,86]。

最后,我们没有考虑发展的不同阶段或基本方案的分层扩展。话虽如此,这里提供的变分表述为形态发生提供了一个有趣的视角,允许我们谈论细胞的信念和行为,因为它们(集体)在自我生成的参考系中航行时需要解决最困难的推理问题。很可能这只是朝着在细胞中形成信念和信息处理的高效、自上而下的控制方式以实现再生医学和合成生物工程应用的重要路标的第一步。也许关于这个空间逆问题的最后一句话应该归功于赫尔姆霍兹[35],第384页。

我们所做的每一个动作,通过它我们改变物体的外观,都应该被视为一个旨在测试我们是否正确理解了我们面前现象的不变关系的实验,即它们在确定的空间关系中的存在。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-02-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档