前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >视觉双稳态感知的神经递质机制

视觉双稳态感知的神经递质机制

作者头像
用户1908973
发布2024-04-19 14:59:58
880
发布2024-04-19 14:59:58
举报
文章被收录于专栏:CreateAMindCreateAMind

Bistable perception, precision and neuromodulation

Abstract

双稳态感知是通过观察具有两种可能解释的模糊刺激而产生的。在这里,我们提出了双稳态感知的主动(贝叶斯)推理解释,并假设同一刺激的不同解释(即推理)之间的感知转换是由将焦点转移到不同视觉特征的特定眼球运动引起的。从形式上来说,这些推论是精确控制的结果,精确控制决定了信念的可信度,并改变人们感知和交替两种不同感知的频率。我们假设精密调制可以通过多种但不同的方式相互作用,从而产生相似的双稳态感知频率。我们使用内克尔立方范式的数值模拟验证了这一点,并演示了支持感知交替频率的多种途径。我们的结果提供了复杂的精密天平承保双稳态感知的(主动)计算说明。重要的是,这些精确参数可以被认为是特定神经递质(即乙酰胆碱、去甲肾上腺素、多巴胺)的计算同源物,这些神经递质先前已与控制双稳态感知有关,从而提供了神经化学和感知之间的计算联系。

关键词:主动推理;双稳态感知;神经调节剂;精确。

Introduction

双稳态感知是通过观察具有两种可能解释的模糊刺激而产生的,例如内克立方体或鲁宾花瓶。在这里,当刺激提供两种无法同时感知的不同解释时,就会出现视觉感知的交替(Brascamp et al. 2018)。例如,在观察内克尔立方体时,个体会在感知向左或向右的立方体之间切换。实验表明,神经递质对于调节这种现象至关重要(van Loon et al. 2013),具体而言,涉及儿茶酚胺能(Pfeffer et al. 2018)、多巴胺能(Schmack et al. 2013)、胆碱能(Sheynin et al. 2013)。 2020)和去甲肾上腺素能神经传递(Einhauser et al. 2008)调节知觉转换的频率。后一项工作通过瞳孔扩张间接研究了去甲肾上腺素 参见(Larsen 和 Waters 2018)。在我们的研究中,我们提供了这些特定神经递质如何影响双稳态感知的计算解释。为此,我们依赖于它们的计算同系物 即主动(贝叶斯)推理下的精确调制(Parr 和 Friston 2017) 如何引起感知交替。

主动推理是大脑功能的贝叶斯公式,它将感知和行动视为“不证自明” (Hohwy 2016)或最小化随时间变化的自由能(Friston 等人,2017 年; Kaplan 和 Friston 2018 年; Friston 2019 年; Da Costa 等人,2017 年)。 2020)。它将感知描述为跨越所有可能假设空间的推理过程(Von Helmholtz 1867; Clark 2013)这可能会产生特定的刺激(Friston 2005)。

这些推论是对特定模型分布的置信度(或精确度)的结果。从广义上讲,此类模型包含生成可观察的感官数据的“隐藏”状态或原因序列。例如,如果给定原因的感觉输入的概率极其精确,那么人们就可以自信地将感觉观察归因于特定原因。相反,不精确的概率分布意味着因果关系之间的模糊关联,而感官观察对于解决其原因的不确定性几乎无济于事。这正是精确控制可以影响推理类型并通过模仿特定神经调节剂的作用诱导双稳态感知的原因(Moran 等人,2017)。2013年;施瓦滕贝克等人。 2015年;帕尔等人。 2018;文森特等人。 2019)。

在这里,我们使用特定的精度参数来研究支持双稳态感知的计算机制。我们假设精确控制可以通过多种但不同的方式相互作用,从而产生双稳态感知。这些精确的操作会影响人们感知(以及在两种不同的感知之间交替)的频率,并说明一种支持双稳态感知的复杂的精确平衡。明确地,我们评估了可能引起双稳态感知的三种不同模型分布的多种精度组合。这些是(i)感觉精度,(ii)状态转换精度,以及(iii)概率精度行动计划,因为这些被认为是由乙酰胆碱(ACh) (Moran 等人,2013 年; Parr 等人,2018 年)、去甲肾上腺素(Vincent 等人,2019 年)和多巴胺(Schwartenbeck 等人,2015 年)介导的,积极地。

为了演示感知切换(作为各种精度的函数),我们实例化了 Necker 立方范式的主动推理模型(Gregory 1980)。在这里,我们将使用代理和模型来表示同一事物。在这个例子中,向代理呈现一个模糊的静态图像,即内克立方体,并推断其原因,即立方体面向右侧或左侧。代理在两个推断(即感知)方向之间交替的速度和频率取决于更新特定信念的置信度(由不同的精度参数调制)。

我们在表1中讨论了这些精确术语、它们的神经调节同系物以及在促进双稳态感知中的作用之间的对应关系。不可避免的是,这些关联都过于简单化了。然而,它们是有用的启发式方法,似乎与神经调节功能的许多数据一致。

简而言之,感觉精度(似然函数)决定了对结果原因的信念的信心。因此,这个定义可以解读为心理学中的(选择性)注意力(Feldman 和 Friston 2010; Mirza 等人 2019)。换句话说,通过以上下文特定的方式调节感官精度,模型可以选择性地关注与任务相关的刺激(Mirza 等人,2021)。类似地,状态转换的精度对隐藏状态的波动性进行建模。如果这是极其精确的,那么智能体就会对状态随时间的演变有很高的信心。相反,在状态转换精度较低的情况下,智能体对未来状态的信念将逐渐变得更加不确定(即高香农熵)

最后,可能的行动计划(即政策选择)的精度决定了对所选行动轨迹或政策的置信度。我们预计,增加这些精度中的每一个都会降低由对感知方向(或视觉上下文)的精确信念引起的视觉感知交替的频率,独立于其他精度项。我们分析了不同精度值下定向的后验概率。我们假设所有三个精度项都会引起置信更新和随后的切换率发生类似的变化(参见表1 )。换句话说,精确操作的差异效应是根据合成受试者在每次感知切换时“相信”的内容来评估的。

此篇文章的结构如下。首先,我们回顾双稳态感知的正式(即计算)解释。接下来,我们简要介绍主动推理,特别关注精度。这提供了一个很好的继续来介绍我们的生成模型来模拟内克立方体的双稳态感知;双稳态感知文献中的规范范式(Kornmeier 和 Bach 2005; Wernery 等人 2015; Choi 等人 2020)。然后,该模型用于测试我们关于双稳态感知产生的多种不同途径的假设。最后,我们讨论结果,以了解我们的模拟精度操作如何与大脑中的神经调节相关。

Computational accounts of bistable perception

此前,人们曾多次尝试解释双稳态感知现象,从动力系统模型(Fürstenau 2007、2010、2014 )到预测处理框架(Dayan 1998; Hohwy 等人,2008;Brascamp 等人,2014 ) 。2018;莱普图尔戈斯等人。 2020a;莱普图尔戈斯等人。 2020b)。后一种解释包括一个表述(Wang et al. 2013; Sterzer et al. 2013)。2017年;魏尔哈默等人。 2017年; Robinson 2018)将知觉转换描述为由于被抑制知觉的残余证据而出现的预测错误的结果。在这种情况下,双稳态感知产生于预测误差的逐渐增加,而现有感知无法解释这一误差,从而产生了替代解释(Weilnhammer 等人,2017)。我们使用主动推理来扩展双稳态感知的描述。我们明确地说明,精度的变化(针对不同的模型参数)可以通过影响感官观察推断的可信度来产生双稳态感知。

我们的解释也与 Weilnhammer 等人提出的另一种双稳态感知模型一致。 (2021)。他们观察到,双稳态感知是由于大脑可用的感官信息的波动而产生的。这种波动可以通过扫视抑制(扫视期间感觉通路的抑制)来解释(Crevecoeur 和 Kording 2017),并可能导致知觉交替增加。在预测处理的情况下,这种抑制依赖于大脑在动作感知周期的不同时间分配给感觉数据的精度的变化。这强调了眼球运动对于理解双稳态感知是必要的,因此可以提供感官精确度的行为证据调制。重要的是,这与我们的模型相一致,证明双稳态感知是(i)通过不同水平的(感觉)精度进行调节的,以及(ii)通过实验与眼球运动(即主动视觉或推理)联系起来。

另外, Parr 等人。 (2019)使用主动推理来研究支持双稳态感知的计算机制。他们假设,当两种不同的感知可能由不同的刺激特征(例如视野中不同位置的亮度对比度)支持时,双稳态感知是针对某些刺激特征的(隐蔽)注意力部署交替的结果。这种交替是与无人关注的特征相关的感知的不确定性积累的结果。通过选择部署注意力来解决这种不确定性,我们改变了我们的焦点,从而改变了我们的看法。伴随该假设的数值实验表明,根据所做出的推论,不同精度参数的变化会影响转换频率。这一过程与关注虚幻物体不同部分的眼球运动有关,这符合双稳态感知的主动视觉公式的呼吁(Safavi 和 Dayan 2022)。

Materials and methods

在这里,我们简要描述主动推理和精度参数,它们支持可能产生双稳态感知的计算机制。

Active inference

主动推理是自由能原理的推论,是描述与外部环境交互的自组织(动态)系统行为的正式方法。它假设这些系统通过最小化它们对感官观察的惊讶(o)来进行自组织,即最大化它们的(贝叶斯)模型证据(Friston et al. 2010; Sajid et al. 2022)或“不证自明”(Hohwy 2016) 。 Surprisal 是结果概率的负对数,即 −ln P(o)。形式上,这涉及自由能泛函的优化,即 sur‑prisal 的上限(Beal 2003; Da Costa 等人 2020; Sajid 等人 2021)。该函数可以根据复杂性和准确性进行分解,因此其最小化意味着找到对感官观察的准确解释,从而产生最小的复杂性成本:

这里, DKL是 Kullback‑Leibler 散度,测量两个分布之间的统计距离, o和s分别指结果和隐藏状态(或原因)。自由能取决于包含概率分布P的生成模型,该概率分布描述(未观察到的)原因和(观察到的)结果的联合概率。这种生成模型通常根据从隐藏原因到结果的(可能性)映射以及隐藏原因的先验来指定。 (1) 中的近似后验分布 Q 表示有关隐藏状态的假设的(后验)概率,基于代理人的观察。通过选择那些最小化预期自由能 (G) 的策略(即可能的行动轨迹),可以减少预期观测的不确定性(Parr 和 Friston 2019):

其中 π 指的是策略, t是(未来)时间步长。 G(π) 是每个未来时间步的 G(π, t) 之和。出于本文的目的,我们的智能体仅考虑下一个时间点,该和只有一项,即 G(π) = G(π, t)。预期的自由能为智能体提供了一种正式的方式来评估不同的政策,即它们满足智能体偏好的可能性以及关于世界隐藏状态的信息增益。变分自由能(F)对智能体生成模型解释观察到的结果的能力进行评分,而预期自由能(G)则量化在特定政策或行动下预期的未来结果的自由能。然后根据每个策略的预期自由能选择策略,该自由能由精度参数 γ 调节:

其中 σ 指的是 softmax 函数。因此,γ 的值越高,对行为的信念就越精确。换句话说,政策选择变得更加自信。总之,主动推理表明(变化的和预期的)自由能在特定的环境模型(即生成模型)下最小化(Friston 等人,2017)。这些生成模型编码了有关当前事态的特定假设。实际上,代理分别表示策略、模型参数、似然函数和转换函数的联合概率:

A参数编码状态‑结果对的概率分布(即似然分布), B编码隐藏状态转换的概率分布(即转换分布)。两者都被指定为分类分布。精度项 ζ 、 ω 、 γ 是温度逆参数。

精度较高时,概率最高的类别收敛于 1,而精度较低时,类别往往具有相等的概率(Parr 和 Friston 2017; Sajid 等人 2020b)。上述概率分布描述了环境中产生结果的状态之间的转换。它们的转变取决于行动,而行动是从对政策的事后信念中取样的。因此,抽样的行动改变了世界的状况,产生了新的结果;并继续感知‑行动循环。出于本文的目的,我们将假设精度参数的先验本身是无限精确的。这意味着在整个试验过程中精度值是恒定的。有关公式 4 的更多数学细节,请参阅补充材料 (A)和表S1。

Precision modulation

我们假设这些精度参数(ζ、ω、γ)可以独立调节双稳态感知,因为它们可以塑造感知信心和推断世界状态交替的频率。 ζ 是生成模型中似然分布A的概率的感觉精度,其中(隐藏)状态映射到观测值。因此,感官精度表示模型从观察中推断原因的置信度。实际上,高精度(例如> 16)可确保模型确信潜在状态将可靠地生成特定结果。相反,低精度(例如< 0.2)意味着原因和结果之间的关系不明确,而观察对于解决其原因的不确定性几乎没有作用。从当前状态st到下一个st+1的概率映射由状态转移矩阵 B 表示。 ω 项对状态转移矩阵的精度进行编码,表示模型从过去预测现在的置信度。对政策信念的精确度由 γ 编码,它对应于模型自信地选择下一步行动的能力。

我们假设所有三个精度项的增加都会导致感知转换频率降低。此外,我们希望解决如何通过眼球运动频率、敏锐度(使用切换后感知置信度测量)以及最后通过调节效应来区分每个精确项(即神经调节剂)对双稳态感知的影响。编码内克立方体不同感知的神经元反应。

Precision and neuromodulatory systems

这些精度参数之前已与特定的神经调节系统相关联(Parr 和 Friston 2017;Parr 等人 2018;Sajid 等人 2020a)——参见(表 1)。简而言之,感觉精度(z)、状态转换精度(ω)和策略精度(γ)可以分别理解为胆碱能、去甲肾上腺素能和多巴胺能神经传递。一些实证研究表明胆碱能释放和知觉转变(频率)之间存在联系。例如,谢宁等人。(2020) 证明,乙酰胆碱传递的增强会减弱双眼竞争过程中的知觉抑制。同样,去甲肾上腺素能释放的增加也与知觉波动频率的改变有关(Pfeffer et al. 2018)。普费弗等人。(2018) 证明,高儿茶酚胺水平改变了群体活动内在变异性的时间结构,并增加了由模糊视觉刺激引起的知觉改变的频率。最后,多巴胺能改变也与更快的知觉转换频率相关(Schmack 等人,2013) )。

Simulations of Necker cube paradigm

在剩下的部分中,我们使用内克立方范式的模拟来模拟双稳态感知以及支撑它的复杂的精确平衡。Einhäuser 等人的一项重要发现。(2004)的观点是,在知觉转变之前,眼球运动会转向主导方向。这意味着知觉转变是由眼球运动后获取的新视觉数据引起的。类似地,时间离散化(隐含在主动推理方案中)涉及一系列散布着行动的(感知)信念更新。这模拟了 Einhäuser 等人的发现。(2004);因为感知的切换发生在(扫视)动作之后,此时视觉采样的焦点发生了变化。它还补充了这一发现,因为眼跳本身是根据最后一次注视期间做出的感知推断来选择的。

A generative model of the Necker cube

我们的内克立方体范式的生成模型有两个隐藏状态:注视点和方向,以及两种结果模式:位置和特征(图 1)。隐藏状态注视点具有代表左下、右上、初始位置注视位置的三个级别,方向状态具有代表左和右方向的两个级别。这些注视点位置是由 Einhäuser 等人提出的。(2004) 和 Choi 等人。(2020),他们观察了知觉切换过程中这些特定注视点之间的眼球运动。结果报告眼睛注视的位置:初始、右上或左下。结果特征报告正在观察的立方体的角:角 1 (C1)、角 2 (C2) 或两者都不是(标记为 null)。

似然函数将状态映射到结果(即状态-结果对)。这里,特征可能性取决于注视点和方向因素。对于生成过程(即我们在模拟过程中用于生成观察结果的过程),可能性仅取决于注视点因子。因此,它生成的结果与方向状态无关。相反,生成模型的可能性取决于注视点和方向因素,并明确地将每个注视点映射到特定方向(见图 1)。因此,左下(右上)注视位置仅在左下方合理 (右)方向。接下来,我们通过注视点因子为模型配备了对眼球运动的控制状态(即,其转换取决于动作的状态)。因此,它可以控制是否注视右上角、左下角或初始注视点。方向转换是不可控的,并且当前状态和未来状态之间的映射被表达为使得左(右)方向总是转换到左(右)方向(图1)。

此外,智能体配备了强烈的偏好(以自然单位测量),以避免零结果(−20 自然单位):见图 3。这是为了鼓励智能体对左下和上采样。正确的位置——因为这些位置之间的眼球运动已被证明与内克尔立方范式中的知觉转变相关(Einhäuseret al. 2004;Choi et al. 2020)。在每个时间点,代理可以从三种不同的操作(即一步策略)中进行选择,即固定在初始位置、左下角或右上角位置。关于初始状态的先验信念对于左右方向被初始化为 0.5,对于初始注视点为 1,否则为零。

Precision and perceptual alternation

Necker 立方体生成模型用于演示支持双稳态感知的计算机制。为此,我们模拟了 729 个模型,这些模型具有三个精度参数的不同组合:感知精度 (z)、状态转换精度 (ω) 和策略精度 ( γ)。表 2 中指定了所使用的精度值。

ζ是与似然分布 A 相关的感觉精度,即哪些(隐藏)状态引起了特定的观测(其中 ε = 8 是一个防止数值溢出的小数字):

其中 i 代表结果,j 和 k 分别代表方向(左或右)和注视点(左下或右上)因素。有关以下方程中使用的表达式描述的更多详细信息,请参阅补充材料中的表 S1。请注意,为了清楚起见,我们排除了初始注视点,因为它的似然矩阵在生成模型中没有提供信息。这两个因素在左下注视点和右侧方向的组合中不相等,反之亦然(见图 2)。粗体 A 表示数据生成方式的似然矩阵(即从状态到位置和特征结果的精确映射)。

这里,精度参数 z 仅调节给定固定点下的首选方向的列 [即 左下注视点(标记为 1)映射到右侧方向(标记为 2),反之亦然],而非首选方向被参数化为均匀分布。以这种方式调整似然矩阵的列可以被视为在模型反转或感知推理期间操纵神经元群体的相对敏感性——将每个可能(隐藏)状态的概率编码为感觉传入。

明确地,生成模型似然分布与 Ai,j,k 之间的联系如下:

其中似然分布将隐藏状态映射到给定感觉精度参数 (ζ ) 和生成过程似然分布 (A) 的结果。

图 2A 提供了精度参数值如何调节特征似然的图形说明。这里,感觉精度参数 (z ) 将方向状态到特征结果的映射调节为位置状态的函数。在此参数化下,高感觉精度 z ≥ 0.5(图 2A 中两行右侧的矩阵)导致状态对左下位置 - 右方向和右上位置 - 左方向的精确似然映射 因此,代理会将 C1 归因于左下位置下的右侧方向,将 C2 归因于右上角位置下的左侧方向。相反,在低感官精度下,从方向和位置到特征结果的似然映射变得不精确(图 2A 中的左图)。通过这种映射,无论采样的注视位置如何,智能体都无法通过感知方向来消除 C1 和 C2 结果的原因之间的歧义。假设立方体是不透明的,我们根据特征的可见程度来激励对这些似然映射的选择。在此假设下,对于左向立方体,人们不应该能够看到 Corner-1。类似地,人们不应该能够看到右向立方体的 Corner-2(左右方向参见图 1)。这些假设被转化为上述方向和注视点组合的特征结果的似然映射, 其精度由 ζ 编码。

从当前状态 st 到下一个 st+1 的概率映射由状态转移矩阵 B 表示。项 ω 以与项 ζ 相同的方式编码状态转移矩阵的精度:

其中粗体B表示隐藏状态如何变化并产生新观察的转变,其在生成过程中被定义为单位矩阵。B 矩阵表示模型从过去和未来预测现在的置信度,反之亦然。据此,生成模型转移分布与B之间的联系如下:

其中,给定转换精度参数 (ω) 和生成过程转换分布 (B),转换分布将当前隐藏状态映射到未来隐藏状态。

图 2B 提供了精度如何改变方向状态转换矩阵的图示。方向状态转换 (ω) 精度的提高导致当前时间点和下一个时间点的方向之间的精确映射(图 2B 的右图)。有了精确的转换矩阵,智能体就会期望方向随着时间的推移保持不变。相反,在低精度下,代理会期望方向频繁变化(图 2B 的左图)。

如图 2C 所示,γ 调节眼球运动选择的置信度。具体来说,当γ参数较高时,动作的置信度较大,因此动作选择更加一致(即,将选择最可能的动作)。相反,较低的 γ 参数会降低策略后验信念的精度,从而导致更加随机的动作选择(类似于匹配行为)。形式化如下:

其中G是伽马分布,γ = 1β表示政策信念的精度(逆温度),β是政策信念的温度先验期望(逆精度)。

Perceptual switch definition

接下来,我们量化了感知转换的构成。这对于量化给定特定精度组合的感知转变的数量是必要的。此处,当特定方向(例如向左)在当前时间点 (t) 具有高后验概率 (> 0.5) 但在前一时间点 (t - ) 具有低后验概率 (< 0.5) 时,就会对切换进行计数 1):

在方程(10)中,粗体 s 变量是参数化我们的近似后验 Q(s) 的概率。直观上,这意味着切换被定义为从“左(或右)方向最有可能”的信念转变为“右(或左)方向最可能”的信念。出于本文的目的,我们使用了 0.5 的阈值,但也可以使用具有更高置信度的阈值(例如 0.6)。在这种情况下,给定方向的 0.4 到 0.6 之间的概率可能被视为二维线的概率加权混合。

Results

Face-validation

在这里,我们提出了一个数值模拟,该模拟建立了内克尔立方体生成模型的表面有效性。为此,我们用任意精度值模拟了模型;具体来说,z = 0.1,γ = 1,ω = 0.1 (图3)。随着试验的进展,我们观察到对方向的交替推论。这是由对内克立方体不同角进行采样的眼球运动变化引起的。根据我们的定义,当满足上述两个条件时,在时间点 7 观察到知觉转换(图3 的第一行)。相反,在时间步长 2 时不会对感知切换进行计数,因为前一时间步长 1 处适当方向的后验概率不是 < 0.5,而是恰好为 0.5。此外,这个开关通常伴随着一个动作 见图3的中间面板。模拟感知开关使用等式(10)中的标准,我们测量了不同精度组合下的感知开关数量(表2)。使用随机种子初始化,每个精度组合被模拟 64 次,试验长度为 32 个时期。图 4显示了每种精密组合下的平均开关数量。平均而言,精度的提高(无论相应的模型参数如何)都会减少感知转换的数量,而与其他精度项无关。例如,当 ω 从 0.001 增加到 10 时,我们观察到感知转换的数量减少。考虑到我们对图2的观察,这并不令人意外,即对于高 ω 值,跨时间的信念传播得更加自信。因此,在试验过程中方向不会频繁改变,并减少感知切换。对于 z 来说,精度的提高使人们对所感知的内容有了更高的信心,从而消除了不确定性最小化行为,这种行为会导致对其他注视点进行采样,从而增加感知切换的机会。然而,值得注意的是,对于高 ζ 和低 ω 值的特定组合,开关数量会增加(图4;左上图和中图)。此外,策略选择(γ)的精确度降低会增加感知切换。这是因为低 γ 值使所有策略更有可能发生,从而导致眼球运动频率更高,并最终导致感知转换。

上述观察结果均基于相对简单的见解。对于非零精度参数,最佳操作始终是继续注视同一位置。这是因为与我们当前注视位置相关的观察结果支持对特定方向的信念(例如,如果看左下角,则为右侧方向)。根据这种信念,替代位置(例如右上角)没有提供任何信息,因为如果立方体(部分)不透明,则那里几乎没有有用的视觉信息,而对角被立方体的近表面遮挡。换句话说,如果我看向左下角并推断立方体处于正确的方向,我会期望右上角的角将不可见,因此没有理由看那里。因此,与其他位置相比,当前位置的预期自由能始终较低。结果是切换频率较低,只有当从相对不可能的移动眼睛的动作中采样时才会发生切换。然而,这种行为的相对可能性是由精度参数调节的。方向不确定性的增加(通过感觉或转换精度的降低)会减弱每个动作的预期自由能之间的差异,从而导致动作选择的不确定性增加并增加开关的数量。感觉精度参数的情况稍微复杂一些,因为它具有双重作用。第一个是确定方向的置信度(从可能不可靠的感官数据推断)。第二个是确定每个位置的模糊性(这有助于预期的自由能)。

政策精度的降低减弱了预期自由能对行动选择的影响,从而使不可能的行动相对不太可能发生,并增加了转换率。简而言之,当更大的不确定性有利于更多地随机偏离维持固定的最佳策略时,转换率就会发生变化。更大的随机性会导致动作选择的更大可变性,因为竞争注视之间的概率差异减小,从而导致从具有较小预期自由能的位置进行采样的更多机会。或者,这也可以表示为选择最小化模糊性的策略,即给定隐藏状态的感官结果的预期不确定性:参见方程(2)。因此,预期自由能较低的政策更有可能被选择,因为它更有可能提供精确、明确的结果。

Dissociating individual precision manipulations

为了分离双稳态感知过程中每个精度的个体影响,我们研究了切换发生后立方体方向的(平均)后验概率以及平均切换率。这里,后验概率表示用于识别开关的 sleft,t 或 sright,t 值(等式(10))。通过单独考虑每个精度并在所有可能的组合中取其(边际)平均值来评估每个精度的差异(图 5;表 3)。这些差异表明,z 和 ω 的后验切换概率和平均切换率遵循非线性关系,如使用多项式展开建模的那样(表 3)。相反,我们观察到后验切换概率和 γ 的平均切换数存在负线性关联(即一阶多项式)(图 5A)。这凸显了决定切换率的高后验切换概率(即值 > 0.5)可以通过多种方式体现——请参阅补充文本 (B) 进行进一步分析。此外,不同精度项的切换后验概率和切换数量之间存在简并(多对一)映射(图 5C)。这说明感知转变可以通过多种但不同的途径发生。

Discussion

我们研究了精确操纵如何支持双稳态感知。为此,我们将双稳态知觉(即知觉在静态刺激的不同解释之间交替的现象)视为与特定眼球运动相关的激活过程,该眼球运动将焦点从一个视觉特征转移到另一个视觉特征,从而导致知觉转变(Einhäuser et al. al. 2004;Choi 等人,2020)。这是由于对视觉刺激的不同特征进行采样时推断的感知和感官观察之间的分离(Brascamp et al. 2018)而产生的。通过计算,我们表明两种感知之间的切换频率取决于(至少 )三个精确项,决定后验信念的置信度。在这里,我们说明了与神经调节剂相关的精确(超)参数可以通过多种不同的方式相互作用来影响双稳态感知以及如何分离它们的影响 使用后验信念的事后分析来相互区分。下面,我们根据之前的文献综述(Parr 和 Friston 2017)将不同的精确术语与神经调制器联系起来。

Precision manipulation and neuromodulation

感觉精度被认为是通过主动推理框架(Parr 和 Friston 2017)和标准化模型(Schmitz 和 Duncan 2018)中的 ACh 进行调节的。Pfeffer 等人研究了这种神经调节剂对双稳态感知的影响。(2018) 和 Sheynin 等人。(2020)的结果显然不一致,要么不影响切换率,要么降低切换率。根据我们的分析,我们发现,当涉及到切换频率时,感觉精度 ζ 取决于其他精度(图 4),因此仅观察切换速率似乎不足以剖析该神经调节器的具体贡献。因此,我们将模拟数据拟合到多项式展开式中,以理清各个精度项的贡献。从这个分析中,我们看到感觉精度的提高应该强调感知方向的敏锐度——假设相当于切换后的感知置信度——这与 Sheynin 等人的观点一致。(2020)。

ω 精度之前曾与去甲肾上腺素能释放相关(Parr 和 Friston 2017)。Pfeffer 等人的一项研究。(2018)使用去甲肾上腺素再摄取抑制剂来研究这一点。他们发现,在服用增强去甲肾上腺素的药物后,参与者报告双稳态刺激的切换速度更快。如上所述,仅考虑切换率的测量,很难剖析神经调制器(将其视为精确调制器)在双稳态感知任务中的具体贡献。此外,双稳态感知显示与瞳孔扩张密切相关(Einhauser 等人,2008) ; Hupé et al. 2009; Kloosterman et al. 2015),这与去甲肾上腺素能释放有关(Larsen and Waters 2018),因此除了我们当前模型中的眼球运动之外,未来的工作还可以针对瞳孔扩张。

然而,Brascamp 等人(2021)表明,只有瞳孔的特定变化与去甲肾上腺素有关。因此,在进一步阐明神经调节和瞳孔扩张之间的联系之前,应谨慎解释其与双稳态知觉的联系。

我们还表明,高政策精度 γ 降低了双稳态感知交替的频率。这个精确参数被认为与多巴胺有关(Parr and Friston 2017),但很少有研究关注多巴胺和双稳态知觉或双眼竞争的作用。尽管如此,Schmack 等人的一项研究。(2013) 表明,与多巴胺受体 D4 (DRD4) 基因携带者相关的感知开关存在可观察到的变化,但这种效应仅在特定等位基因 (DRD4-2R) 中发现,而在其他等位基因 (DRD4-4R 和 DRD7R) 中没有发现。。此外,近藤等人。(2012) 发现多巴胺能基因对视觉知觉转换率没有影响。然而,对于听觉双稳态感知,合成这种神经递质的突出等位基因的存在减少了开关的数量。目前还没有完全了解这些特定基因如何影响多巴胺能神经回路,因此关于多巴胺是否以及如何针对双稳态感知的具体结论仍然悬而未决。

上述三种神经调节剂只是影响双稳态知觉的所有神经调节剂中的一小部分。例如,已证明裸盖菇素(一种主要针对 5HT2a 受体(即血清素受体)的化学物质)也能调节知觉转换(Carter 等) 等人,2005 年;卡特等人,2007 年)。我们对其他三种神经调节剂的关注是由于先前存在的关于它们作为调节精度的作用的假设。然而,我们希望在未来的工作中使用本文提出的方法来涵盖其他关键的神经调节系统。

为了测试我们的模型,人们可以使用药理学药物来直接操纵我们在数值研究中研究的神经调节剂。具体来说,为了研究胆碱能神经传递,可以使用多奈哌齐药物,如 Sheynin 等人所述。(2020),或也可降低乙酰胆碱水平的利斯的明 (Sadowsky et al. 2005)。请注意,虽然这两种药物都抑制乙酰胆碱酯酶,但卡巴拉汀还抑制丁酰胆碱酯酶(另一种分解乙酰胆碱的酶)。这种双重抑制可能使卡巴拉汀在某些条件下具有更广泛的作用谱,并与多奈哌齐相比增加了观察到的行为差异。类似地,多巴胺能神经传递通过哌醋甲酯的给药来调节(Gottlieb 2001)。原则上,这些药理学干预措施可用于测试多巴胺对根据我们的模型预测的知觉转换率的影响。

最后,可以使用去甲肾上腺素再摄取抑制剂来控制去甲肾上腺素能神经传递。例如,Pfeffer 等人之后的原子奥西汀。(2018)。这些神经调节干预措施也可以与双相情感障碍患者的研究进行比较,双相情感障碍患者的研究显示双稳态知觉的转换率受到调节(Miller 等人,2003 年;Ngo 等人,2011 年;Ye 等人,2019 年),以及 上述所有三种神经调节剂的不规则性(Manji et al. 2003)。这为使用我们的范式通过计算镜头研究双相情感障碍提供了潜在的联系。有趣的是,利奥波德等人。(2002) 表明周期性遮挡会导致较少的切换,这可能与过渡精度有关。这是否也会改变去甲肾上腺素的水平(例如通过瞳孔测量)可能是未来一个有趣的追求方向。

Neuroanatomy

这里研究的精确术语的部署可以与基于特征的注意力(FBA)相关联,因为这里的感知开关被理解为方向的开关。这一观点也得到了参与处理双稳态知觉和 FBA 的大脑区域的相似性的证实,因为两者都会激活额叶眼区、顶内皮层、颞顶交界处和下额叶交界处等区域(Brascamp 等人,2018 年;Zhang 等人,2018 年)。2018;Loied 和 Preuschoff 2020)。有趣的是,所有与此处使用的不同精确术语相关的神经调节剂都涉及注意力处理(Thiele 和 Bellgrove 2018)。FBA 网络可能部分通过调节不同的神经调节剂来部署注意力机制,这些神经调节剂会导致不同的神经生物学变化,但会导致重叠的行为。这与之前报道的通过额顶叶网络自上而下的双稳态感知调制有关(De Graaf et al. 2011)。

一系列皮质区域——整个早期视觉和注意力网络——通常与多稳态感知有关,特别是内克尔立方体。事实上,这样的范式有时用于寻找意识的神经关联(Sterzer et al. 2009;Blake et al. 2014;Koch et al. 2016;Seth and Bayne 2022);试图识别其活动与主观体验相关的大脑区域。这是因为它们能够在不改变感官输入的情况下诱导我们对不同感知的意识发生变化。研究表明特定的背侧额叶和顶叶区域有助于促进这些知觉转换(Inui et al. 2000)。这些区域也与注意力处理相关(Vossel et al. 2014),与我们的观点非常一致,强调了注意力(即精确度)调节在选择视觉信息中的核心作用。早期视觉通路已被证明在产生这些知觉转换中发挥着至关重要的作用,这支持了注意力在这些知觉过程中的重要性(Kornmeier 和 Bach 2005)。然而,必须承认该领域关于额叶作用的平行争论。虽然一些人认为额叶本身积极参与感知体验,但另一些人则认为它的参与与注意力和意识等高阶处理任务更加一致(Safavi et al. 2014;Block 2020;Michel 2022) 。这场正在进行的争论虽然没有在这里详尽地讨论,但却为我们对多稳态感知及其神经生物学基础的理解增加了一层额外的复杂性。如需更深入的分析,读者不妨参考 Long 和 Toppino(2004)。

Alternative models of eye movements

我们的主动推理模型提供了双稳态感知的积极解释;然而,与其他眼运动控制模型相比,潜在的眼球运动故意保持简单。因此,将我们的模型与已建立的眼动模型相结合可能会改善行为反应的预测。在这里,我们回顾了几个用于建模眼球运动的关键框架。

一种可能性是使用贝叶斯推理来模拟与注视固定相关的更复杂的眼球运动。例如,博尔吉等人。(2013) 证明了这种识别视觉图像的方法的面部有效性。他们的模型将感官信息与自上而下的模型相结合来预测眼球运动,使用理想的观察者模型,就像我们的公式一样。另外,主动视觉理论也认为主动成分是视觉感知的核心成分,例如显着图模型(Yoo et al. 2021)、引导搜索模型(Wolfe 2021)等。与我们的离散状态空间公式相比,这些模型已用于包含更多来自动作和眼球运动动力学的信息。值得一提的是,强化学习(RL)模型还将眼球运动和动作视为寻求优化其性能的智能体做出的决策。因此,一些 RL 方案类似于我们的公式,依赖于优化某些目标分布的顺序决策;具体来说,是预期回报(Reichle 和 Laurent 2006)。强化学习已被用于模拟囊膜抑制及其如何影响视觉图像位移(Ziesche et al. 2017)。

Limitations and future directions

我们工作的一个关键限制是我们包含了有限数量的可能的注视点,这使得眼球运动的研究过于简单化。包括更多的固定点和行动可以为实证研究和真实数据的拟合提供更适用的模型。接下来,我们预先指定初始概率和精度值,而不是在每次试验期间更新它们。未来的工作应该探索这些精度的在线选择以及它们如何影响基于任务的双稳态感知。这与心理行为有关,即通过调节精度来改变后验信念的内部过程(Metzinger 2017;Limanowski 和 Friston 2018),并且可以通过分层模型添加,其中模型的较慢部分调节影响更快动态的精度项 (Hesp 等人,2021)。了解精确参数是如何学习的,我们还可以检查神经调节器的动力学,因为到目前为止,我们已经研究了静态环境中的这些影响。最后,我们只关注内克尔立方体来阐明双稳态。然而,其他双稳态图形 - 例如 鲁宾花瓶——表现出与眼球运动的不同联系。在这些情况下,眼球运动有助于消除感知的歧义(Naji 和 Freeman2004);而不是引发模棱两可的解释。因此,眼睛运动不是双稳态期间应考虑的唯一动作,头部运动也应考虑,因为已经证明颈部的位置会影响双稳态(Sato et al. 2022)。这是因为颈部运动会影响模糊性 ,即使没有眼球运动。因此,双稳态感知也可能在没有明显的眼球运动的情况下发生,并且可能依赖于隐蔽的行动,包括空间注意力的部署——参见(Maier 和 Tsuchiya 2021)。

Conclusion

我们已经展示了如何通过三个不同的精度项来操纵双稳态开关。简而言之,我们的公式提供了先前双稳态感知模型的两倍扩展:(i)包含与眼球运动有关的特定公开动作;(ii)演示模型参数之间的简并功能关联以及它们如何支持双稳态感知 。此外,我们利用后验信念的变化来识别感知开关,从而消除了精确性影响。剩下的问题涉及这些精确项在大脑中的合理实现,目前认为它们分别与胆碱能、去甲肾上腺素能和多巴胺能神经回路的状态转换、可能性和策略选择精确项相关。总的来说,我们的结果说明了支持双稳态感知切换率的简并功能架构(Price and Friston 2002;Noppeney et al. 2004;Sajid et al. 2020c),即多个神经调节系统可以调节感知切换率。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-04-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档