前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >综述:自闭症贝叶斯理论的全面回顾

综述:自闭症贝叶斯理论的全面回顾

原创
作者头像
悦影科技
发布2023-12-08 10:26:24
1720
发布2023-12-08 10:26:24
举报

摘要:十年前,Pellicano和Burr发表了一篇在自闭症谱系障碍研究中最有影响力的文章,将它们与大脑中异常的贝叶斯推理过程联系起来。他们特别提出,自闭症患者较少受到大脑对环境的先验信念的影响。在这篇系统综述中,我们调查了这一理论是否得到实验证据的支持。为此,我们收集了所有包括诊断组或自闭症特征比较的研究,并根据调查的先验对其进行分类。我们的结果是高度混合的,有轻微多数的研究发现在贝叶斯先验的整合上没有差异。我们发现,在实验过程中形成的先验比之前获得的先验更频繁地表现出降低的影响,各种研究为参与者群体之间的学习差异提供了证据。最后,我们将重点放在纳入研究的方法和计算方面,显示出低统计能力和经常不一致的方法。基于我们的发现,我们提出了未来研究的指导方针。

1. 引言

介绍自闭症谱系障碍(ASD)是一种高度多样化的神经发育疾病。它通常以社交症状为特征,如心理理论缺陷,社交动机降低,或沟通和社交技能问题。自闭症患者还会经历一系列的感官非典性,包括对刺激的超敏感和低敏感或迷恋,这被称为“感官寻求”行为。此外,他们经常表现出重复的行为,无论是身体运动还是声音产生,对常规和千篇一律的强烈坚持,兴趣狭隘,对细节的关注增加,以及各种执行功能障碍。更复杂的是,研究表明自闭症患者不容易产生错,比一般人有更好的音高记忆,并且在各种视觉搜索和辨别任务中表现优异。

考虑到这种异质性,可以理解的是,许多解释这种情况的尝试都集中在个体症状上,因为用一种理论来解释自闭症谱系的全部广度显然是具有挑战性的。然而,有趣的是,感知和认知的贝叶斯和预测编码理论试图做到这一点。源自感官的信息和内部模型,包括对环境的先前知识。外界信息被认为提供了一种自下而上的信号,从认知层次的较低层次“移动”到较高层次,从具体到一般。例如,自下而上的视觉信号可以从初级视觉皮层传播到梭状回面部区,后者拥有对特定刺激方向敏感的神经元,后者可以识别人脸。另一方面,内部信息被认为是从更高、更认知或抽象的层面开始的,以自上而下的方式影响感知。这两种信号在层次结构的每一级相遇,并结合起来形成我们最终感知到的东西。这些理论有可能解释大量的感知现象,其中最典型的例子之一就是视错觉。例如,在空心面具错觉中,人们看到的是面具的凹面,但他们看到的是一张正常的凸面。根据贝叶斯和预测编码理论,这种情况的发生是因为大脑有一个相当确定的内部模型。因此,该模型对最终感知产生了很大的影响,压倒了来自可能模糊的视觉深度线索的信息。这两种理论都认为感知是外部贝叶斯理论声称,知觉是利用贝叶斯规则推断感官输入的最可能原因。

像贝叶斯大脑理论一样,预测编码将感知视为自上而下和自下而上信号的结合。自上而下的信号代表了大脑对即将感知到的东西的预测,而自下而上的信号则对应了预测和感官输入之间的误差。预测是根据这些预测误差进行调整的,并根据它们的相对确定性或技术术语中的“精度”进行加权。在贝叶斯思维中,这对应于分布方差的倒数。这两种理论最初都是为了具体解释感知而制定的,但后来被扩大为认知甚至运动控制的一般框架。这两种理论并非相互排斥,但它们也不一定重合:贝叶斯方法关注的是正在计算的内容,理论上可以在大脑中以各种方式实现,而预测编码关注的是一种合理的神经算法,可以实现贝叶斯或非贝叶斯计算。

2012年,Pellicano和Burr提出,自闭症可能是由于先验信念在贝叶斯脑计算中的影响减弱,导致先验构建受损或先验整合不当。在对他们文章的回复中,Brock提出了另一种可能性,即自闭症症状可能源于更强的自下而上影响,因为这种影响在数学上与较弱的先验无法区分。然后,在2014年,Lawson、Rees和Friston以及Van de Cruys等人使用分层预测编码框架重新制定了贝叶斯理论。Lawson et al提出自闭症的产生是由于预测精度与预测误差之间的不平衡,导致预测误差的影响更大。Van de Cruys等人认为,与神经典型性相比,自闭症认知的预测误差精度更高,但灵活性更低。虽然每个具体理论的细节不同,但总体结构是相同的:在自闭症的感知和认知中,先验/预测和可能性/预测错误的影响之间会存在不平衡,大脑更多地依赖自下而上的信息,而牺牲自上而下的知识。在本综述的其余部分,我们将称之为不平衡假设。

自2012年以来,已经有多项研究试图证实、反驳这些理论,或者只是用这些理论来解释他们的结果。然而,他们的发现是混杂的,他们的方法也有很大的不同,因此研究人员很难对文献有一个彻底的理解。本综述的主要目的是提供支持或反对自闭症失衡假说的所有相关证据,突出它们的共性和差异。为了做到这一点,我们将系统地搜索提到我们感兴趣的框架的ASD研究,并根据实验先验和相对于不平衡假设的结果对他们的发现进行分类。我们还将介绍贝叶斯和预测编码框架内的其他相关发现,并提出未来的研究方向。在方法论方面,我们将研究各种方法,特别关注理论驱动的计算模型,并试图为未来的研究提供指导。

2. 结果

2.1 已有的先验

所谓“预先存在的先验”,我们指的是参与者在接受任何与任务相关的信息之前,有意识或无意识地拥有的知识或期望。总的来说,这种先验似乎对自闭症谱系障碍没有太大影响。例如,关于几何形状和线条方向的低级先验在诊断组和自闭症特征中是相似的。动作延续的先验也不受自闭症特征的影响。另一方面,对于慢动作的已知先验,有不同的证据,这对高智商参与者的影响降低了,但对自闭症患者自我运动感知的影响增加了。重要的是,研究人员将后一种差异归因于这些参与者更广泛的可能性,而不是更精确的先验,一旦反馈给参与者,这种差异就不再存在。

先验也可以编码更复杂的环境统计。这些在ASD中也不受影响。对光的方向和自然场景的常见颜色的期望在诊断组之间没有差异。当参与者感到惊讶时,物体重量的先验(由物体的大小或明显的材料引起)会导致凝视差异,但在组间和自闭症特征之间观察到类似的感知和举起行为。然而,当刺激在预期和意外重量之间频繁变化时,自闭症个体的表现比神经正常个体更差。此外,脑电图成分表明,没有声音的拍手会导致自闭症参与者更强的预测误差。当参与者是产生实验刺激的人(例如,期望在说话时听到自己的声音)时,也可以调用预先存在的期望。当刺激为听觉时,这些先验对ASD的影响较弱,但当它们是触觉时则不然。具体来说,在说话时,对照组参与者更多地依赖于对自己声音的预测,而自闭症患者更多地依赖于听觉反馈。

另一种先验可以在线索整合过程中找到,因为所有感觉信号来自同一来源的信念可以被描述为耦合先验。这可以通过研究参与者如何组合来自不同刺激的信息来衡量。弱耦合先验将导致参与者主要关注一个信息源。当结合深度和视差信、深度和遮挡线索或视觉和前庭线索时,诊断组之间的先验相似。然而,与失衡假说相反,自闭症患者比对照组更频繁地感知到听觉和视觉线索来自同一来源,这表明先验耦合更强。当信息涉及到一个人的身体时,两组之间也出现了差异。与自闭症或高智商神经典型参与者相比,低智商神经典型参与者的本体感觉信号与视觉和触觉信息的整合程度更高。身体疼痛水平和视觉线索之间的整合在ASD中也有所不同,尽管这一发现可以解释为更强的自下而上的外感受信号,也可以解释为自闭症之前更强的耦合。

考虑到自闭症的症状,社会背景可能与自闭症特别相关。在涉及这类先验的任务中,结果各不相同。先前关于社会图像识别的研究结果好坏参半,ASD的神经影像学测量不同,但行为表现相似,自闭症特征越高,表现越好。凝视感知倾向于前方或环境中更显著的特征,独立于诊断或自闭症特征。识别生物运动也产生了不同的结果。高智商个体表现出较弱的先验影响,而自闭症患者具有类似的一般识别能力,只有在人际、社会暗示的帮助下才表现得比对照组差。另一项研究发现,ASD中跨性别和非二元身份的患病率增加,将其解释为对可接受的性别规范的较弱先验。

2.1.1 预先存在的先验:讨论

从这些研究中我们可以得出什么结论?研究结果喜忧参半,但似乎调查既存先验的研究并不支持普遍的先验-可能性失衡的存在。这并不奇怪。假设较弱的先前影响会导致自闭症个体被他们的环境所淹没。然而,我们知道并不是所有的环境都会造成自闭症患者的痛苦,新环境的压力更大,这表现为对重复和常规的坚持。其原因可能是熟悉环境的先验(即预先存在的先验)没有受到损害。

一个重要的观察结果是,具有社会成分的任务在支持和对比不平衡假设之间几乎平分,而使用更简单的感知先验的任务通常在群体和特征之间没有差异。一方面,这是可以预料的,考虑到自闭症的沟通和心理障碍理论。另一方面,贝叶斯理论对自闭症谱系障碍的主要吸引力在于,它们试图用同样的机制来解释所有的症状,从低水平的感觉敏感性到高水平的社会缺陷。从这部分综述来看,这个框架可能并不适用于该障碍的所有方面。

2.2 已知的先验

另一种测试先验可能性不平衡的方法是使用参与者在实验过程中形成新先验的任务。这为研究人员提供了更多的控制,因为他们可以直接操纵影响参与者的环境统计数据。然而,它还引入了一个混杂因素:观察到的结果可能是的产物缺陷在于开发而不是利用前人。

创造先验的一种方法是让参与者熟悉一个复杂的刺激。例如,事先看过原始图像的参与者对扭曲图像的识别能力会增强。这种先验的影响不受自闭症特征的影响,尽管在ASD中的发现是混合的。自闭症患者也更倾向于当他们看到完整的图片时,他们对部分图片的最初解释。另一方面,先前的影响这是由向参与者提供刺激或提问导致的他们想象它不是由自闭特征调节的。

关于视觉刺激的位置,或者他们对“奇数”音调刺激的脑电图反应,但当听觉刺激的节奏不同时,情况并非如此。对重复图像的期望也导致了不同诊断组的fMRI测量结果不同。相比之下,在识别代理动作或搜索特定的线条方向时,频率先验对自闭症患者和对照组具有相似的影响。在对听觉刺激进行分类时,虚构类别的频率导致诊断组之间同样强烈的偏差,尽管在视觉刺激的情况下,它们对高智商个体的影响较小。这两项研究也可以被解释为测量刺激类别的延展性,这种解释与贝叶斯方法的兼容性尚不清楚。其他自闭症特征频率的研究结果也很复杂,高智商个体在识别任务中表现出较弱的自上而下和自下而上信号整合,对频繁刺激的幻觉较少,但与低智商个体相比,对更频繁的重复刺激产生类似的fMRI反应。

频率先验在使用连续刺激的实验中也有影响,在实验中,参与者隐性地学习完整的刺激分布。这种学习通常会导致参与者在估计刺激的值或性质时偏向于分布的平均值。这些“集中倾向”的强度受到自闭症的影响并不一致。例如,一些有视觉刺激的研究发现,ASD患者的视觉刺激较弱,而听觉刺激实验显示各组之间没有差异。三个进一步的听觉实验显示ASD的偏见较弱,但计算模型表明,仅对近期试验的偏差较弱,在刺激分布水平上没有差异。令人惊讶的是,在再现时间间隔时,自闭症患者有更强的集中倾向。然而,作者用更平坦的先验(甚至更平坦的可能性)来解释他们的结果,这种解释与Pellicano和Burr的具体理论一致,但与不平衡假说相矛盾。还有一些证据表明,根据刺激分布,ASD的集中倾向的可塑性较差,并且在失去自闭症诊断的个体中不再存在这种偏见。

旨在让参与者产生更复杂期望的研究得出了不同的结果。当干扰物遵循特定分布时,诊断组之间没有表现差异,尽管各组在行为上确实表现出更细微的差异。移动刺激的双峰分布导致高智商参与者表现出较弱的偏见和较少的视幻觉,尽管这显然是由于更高的感官精度而不是平坦的先验。与此同时,当刺激是连续的时,自闭症高可能性和低可能性的3岁儿童之间或诊断组之间没有差异。最后,当参与者必须了解他们的先前信念不再准确,因此应该停止受它们的影响时,也可能揭示出先前发展的困难。当面对不断变化的刺激取向统计数据时,自闭症患者无法做到这一点,而是继续表现出预先存在的偏见。他们还继续依赖于在实验过程中已经停止提供信息的刺激。

另一种在实验中操纵期望的方法是加入与所呈现的刺激相关的内隐线索。与频率先验相似,在大约一半的实验中,这些期望对ASD或高智商个体的影响有所降低。当听觉线索预测视觉刺激时,自闭症参与者大多表现出较低的先验影响,但当自我产生的线索与听觉刺激的时间相关联时,情况并非如此。此外,在识别代理行为时,环境线索对神经正常参与者的影响大于自闭症参与者。一些研究也关注了自闭症特征中的线索关联。其中一项研究显示,AQ越高,线索对形状识别的影响就越小。同一项研究还包括对Amoruso等人的实验的重复,但没有发现线索影响与AQ之间的关系。在同一项研究中,对Lawson等人的结果进行的AQ复制仅为0。

当研究人员明确提示和刺激位置之间的关系时,实验得出的支持不平衡假说的证据略弱。关于视觉刺激方向的明确线索对自闭症特征的影响相当,在双目竞争任务中不反映实际环境规律的线索也是如此。此外,在决策任务中明确呈现先验信息不会在AQ或诊断组之间产生任何差异。关于听觉刺激时间的视觉线索在自闭症和对照组参与者中也有类似的行为影响,但导致不同的脑电图反应。此外,与目标刺激明确相关的刺激序列在神经正常参与者中具有比自闭症参与者更大的行为和脑电图影响。关于代理人意图的明确信息对自闭症的影响也较小,跟踪刺激位置时的明确线索也是如此。然而,与失衡假说相反,自闭症参与者在基于明确线索预测疼痛刺激时表现出更强的fMRI反应和相似的皮肤电导。

一些研究试图直接评估先验,要求参与者在向他们展示任何新的刺激之前,根据他们过去的经验做出预测。例如,向参与者提供一个提示,要求他们猜测随后出现的刺激。在他们做出反应之后,刺激会被展示给他们,假设他们会更新关于刺激关联的先验。这些实验产生了不同的结果。其中一项研究表明,自闭症特征较强的参与者只对社交线索进行不同的处理。有趣的是,基于他人明确信息的社会先验对自闭症个体的影响更大,但那些基于对其行为观察的社会先验在不同群体中是相似的。在简单的感知任务中,自闭症和对照组参与者的运动外推或视觉刺激的积累相似,而自闭症患者在同步他们对听觉节奏刺激的反应方面表现较差,并且当他们的节奏改变时更新速度较慢。语义先验在诊断组之间也有类似的影响。最后,当估计他们在实验环境中的行为影响时,高智商个体的行为不太灵活。

2.2.1 已知的先验:讨论

在具有学习先验的任务中解释结果被证明是具有挑战性的。关于内隐学习先验的发现平均分为正先验和零先验,而提供显性先验信息的任务导致支持发现的比例显着降低。这些观察结果表明,自闭症患者的内隐先验习得可能受到损害,当明确提供先验时,有意识的策略可以减轻这种损害。然而,这与对自闭症学习的直接研究形成鲜明对比,后者发现内隐学习完好无损,但外显学习受损。

试图通过要求参与者预测下一个刺激来直接评估先前发展的研究略微支持了组间差异的存在。不幸的是,这种范式和贝叶斯先验之间的联系并不清楚:贝叶斯先验通常被认为是隐含的,并且不知道是否或在什么情况下可以有意识地使用它们来指导这种判断。即使它们可以被有意识地获取,它们也可能与失衡假说没有直接关系。假设参与者被要求根据先前的刺激预测刺激的特征(例如,它的位置)。在没有其他信息的情况下,最优反应是他们先前信念的平均值。因此,如果两个参与者有相同的先验均值,但精度不同,他们可能会给出相同的回答。因此,此类实验的结果不能揭示任何关于先验精度的信息,也不能代表不平衡假说。另一方面,他们可以指出先前获取的缺陷。

2.3 适应

除了上面提到的研究,在我们的文献检索中,我们发现一些实验设计不能直接归类为既存在的先验或学习的先验。这些研究的很大一部分集中在感觉适应上,这是一种现象,即刺激的呈现会使随后的感知偏离该刺激,并增强对不常见刺激的感知,这可能是通过降低神经元敏感性来实现的。这些排斥效应与传统贝叶斯框架所解释的不同,在传统贝叶斯框架中,先验有助于处理预期刺激,感知偏向于先前的刺激。然而,我们把它们包括在这里,因为自闭症中较弱的感觉适应的发现通常归因于失衡假说。我们还决定包括使用听觉古怪任务测量的不匹配的负面效应,因为我们相信,从感官适应的角度来解释它们比将它们视为违反贝叶斯期望更准确。

视觉适应实验通常没有发现ASD中预期的适应性降低的证据。不同诊断组的颜色适应相似,双眼竞争的适应和自闭症特征的生物速度估计也是如此,有趣的是,但在后一项研究中,当刺激位置发生变化时,高智商被试表现出较弱的感觉适应,区分了局部和整体适应。与之前的结果相反,自闭症儿童对屏幕上刺激数量的适应能力降低,而对面孔的神经适应能力在自闭症可能性很高的两岁儿童中更强。

声音重复导致ASD的信噪比增加,而异常的听觉刺激在两组之间产生了相似的脑电图反应,无论参与者是否被警告。ASD的视听适应明显较弱,但仅与“注意细节”AQ分值负相关,而与AQ总分无关。

2.3.1 适应:讨论

总的来说,这些发现并没有表明ASD患者的感觉适应能力较弱。然而,无论是贝叶斯编码框架还是预测编码框架的核心机制都不能简单地解释自适应效应。有各种各样的理论尝试将适应解释为扩展贝叶斯框架的一部分,尽管它们不在本综述的范围之内。

2.4 其他发现

并不是所有的研究都可以整齐地归入预先存在的先验、后天习得的先验或适应的范畴。一些研究没有具体说明假设先验的性质,虽然他们根据不平衡假设解释了他们的结果,但我们不清楚他们的发现如何用贝叶斯或预测编码解释来形式化。我们将它们包含在本节中是为了完整性,以便与我们的评审选择标准保持一致。

自闭症参与者更善于记住准确的颜色,但在平均时的表现与对照组相似。它们在可分离性方面也表现出非典型的颜色维度处理。自闭症参与者更容易受到视觉噪音的阻碍。这些研究的重点是全局与局部处理,这与贝叶斯框架有关,但尚不清楚他们使用的是什么先前的知识或对环境规律的期望。

在观看社交图像时,在ASD和ADHD参与者和对照组之间发现了凝视差异,但在只有ASD的参与者中没有。当任务目标在任务过程中可预测地改变时,各组之间没有差异。自闭症参与者对任务指令中未指定的异常听觉刺激的关注程度低于对照组。对自闭症患者的定性调查也表明,他们有“中断的时间体验”。最后,两项神经影像学研究聚焦于预测编码相关的神经标记,但在被动观看任务或静息状态下,先验信息的使用并不明显。这些研究表明,神经信号中的可预测信息减少,ASD的反馈连接和局部视觉处理受损。

2.5 总结统计

在下一节中,我们根据与每个参与者样本和先前类型的不平衡假设最相关的研究结果提供汇总统计。例如,Pell等人使用两个不同的样本调查了自闭症和神经正常组之间以及自闭症特征之间的差异;Bianco等人在同一样本中使用了两个不同的任务;Chambon等人在一个样本中使用了一个任务,但研究了既存在的先验和学习的先验的影响。对于每一项研究,我们在分析中都包含了(至少)两个发现。统计基于结果的p值低于或高于0.05显著性阈值(或在多次比较的情况下调整为p值)。

出于两个原因,我们决定不进行meta分析。首先,在大多数研究中,感兴趣的效应量是用f值或相关统计量来表示的,或者完全不存在。在荟萃分析的计算中包含f值可能会显著高估总体效应大小。要避免这种情况,需要使用大多数此类研究无法获得的统计数据进行计算。此外,f值本质上并不表示所呈现效果的方向。对于低于显著性阈值的发现来说,这不是问题,因为在这种情况下,研究人员进行了额外的测试来显示这个方向(例如,ASD中较弱或较强的偏差)。另一方面,这些测试通常不会对非显著结果进行,这使我们无法知道这些结果是否应该被视为不平衡假设或反向不平衡假设的弱证据。第二个原因是我们的研究中存在异质性。这些实验包括神经成像和行为实验,这些实验可以进一步分为fMRI、EEG和MEG研究,以及估计、反应时间、眼动追踪等。在样本方面,他们既观察了自闭症和正常神经参与者之间的差异,也观察了普通人群中儿童和成人自闭症特征之间的差异。在领域方面,他们研究了感知(视觉和听觉)和决策等方面。至于先前的调查,我们已经说明了如何将它们分成不同的类别。因此,将所有这些发现综合起来得出的任何数字都很可能具有误导性。

我们认识到,确定给定研究的哪个发现与不平衡假设最相关永远不可能完全客观,而且仅根据p值对结果进行分类和计数是非常不完美的。尽管如此,我们认为这种方法提供了对该领域急需的广泛概述。主要发现的完整列表及其分类可以在本小节的末尾看到。我们样本中的83项研究共产生了123项与贝叶斯或预测编码解释有关的发现。其中,92个是明确包含先验和可能性的实验设计的结果。该子集的大部分(51%)在组之间或在不平衡假设下的自闭症特征之间没有统计学上的显著差异。37%的证据表明不平衡方向,7%的证据表明不平衡方向,4%的证据表明差异在不平衡假设方面没有明确的解释,1项发现表明没有明确的不平衡解释的组之间没有差异。只关注研究不平衡假设的设计,神经影像学研究导致无效结果的频率远低于行为研究(37%对58%)。

图1显示了先前类别的结果分布,尽管有噪声,但似乎与我们在中期讨论中得出的结论一致。与内隐学习先验相关的研究结果在支持和反对不平衡的存在之间平分,与先前存在的社会先验相关的研究结果显示支持程度略低。另一方面,依赖于既存的非社会先验和明确学习先验的设计大多不支持不平衡假设。“预测”的发现是基于直接的先验估计,而没有感官证据的参与,也暗示了ASD中存在先验发育缺陷。适应性研究结果显示了一些差异,但是,正如我们已经提到的,他们的贝叶斯解释目前还不清楚。

添加图片注释,不超过 140 字(可选)

图1不平衡相关发现在先前类型和结果类别之间的分布。左边的面板包含了所有的发现,而右边的面板只展示了那些测试不平衡假设的结果。左图中最右边的三个类别的发现不被解释为先验似然组合的结果。适应类别中“失衡”编码的发现指的是自闭症患者的适应能力降低。反向失衡类别指的是在ASD中发现更强的先前影响。差异和无差异的研究结果并没有直接检验失衡假说。

在83项研究中,60项研究集中在ASD和对照组的比较上,16项研究使用了普通人群的智商分数,7项研究两者都使用了。总的来说,自闭症特征的发现往往是无效的,不平衡/不平衡/逆转的结果是10/18/1,在临床组比较中是26/28/5。研究自闭症和神经正常的参与者的中位样本量为44人,研究自闭症特征的中位样本量为40人。重要发现的p曲线呈现右偏(图2),这表明没有很强的选择效应,这将导致曲线左偏。然而,并不是所有的选择效应都可以用这种方法检测到,曲线不会随着p值的增加而单调减少,这一事实是弱选择效应的证据。我们进一步使用p曲线应用程序来估计所有提供必要统计数据的研究的统计能力。这表明,所有研究的集合和调查不平衡假设的子集都包含证据值(p< 0.001)

添加图片注释,不超过 140 字(可选)

图2p曲线适用于所有的研究结果和那些研究不平衡假设的人。仅纳入报道的p值小于0.05的结果。这两条曲线都是右偏的,说明没有很强的选择效应,这将导致曲线左偏。的p值附近的百分比略高相对于较小的值0.05是弱选择效应的证据。这里提供33%功率曲线作为不存在选择效应时的曲线示例。

添加图片注释,不超过 140 字(可选)

图3不平衡研究的样本量vs效应量。虚线对应于中位效应大小。这个图相当于一个“折叠”漏斗图,因为所有表示的效应大小都只能是正的。这意味着与正常漏斗图相反,发表偏倚不能在图中显示出来。尽管如此,该图表明,较大的样本量导致较小的效应量。折叠漏斗图的峰值略低于中位数效应值,突出表明中位数可能高估了真实效应值。

研究习得先验的中位数偏平方为0.05,而研究既存先验的中位数偏平方为0.02。在一个预测器的情况下,0.01的值被指定为小,0.06的值被指定为中,0.14的值被指定为大。当存在多个预测因子时,n值可能高估了真实效应大小,这取决于其他预测因子的大小。这意味着目前的效应大小是小到中等的。然而,还有其他原因,报告的中位效应量可能大于真实效应量(图3)。

偏平方取非负值。缺乏关于影响方向的信息(例如,自闭症中更强或更弱的偏见)会自动导致高估中值估计。为了理解这一点,假设有三个相关系数:-0.2、0和0.3,中位数为0。如果效应量用r或n表示,那么0.04、0和0.09之间的中位数效应量为0.04,而实际中位数效应量应为0,因为0.04对应负相关。这是我们在分析中无法避免的,因为许多报告的统计数据没有包含有关结果方向的信息。支持阳性结果的发表偏倚也可能导致对效应大小的高估。这些考虑使我们得出结论,总体真实效应大小很小,并且在先前存在的先验情况下可能接近于零。主要发现效应大小的完整列表见表1

表1主要发现及其分类。

添加图片注释,不超过 140 字(可选)

2.6贝叶斯模型

在我们的研究中,只有13项研究使用了贝叶斯理论驱动的计算方法。在本节中,我们将详细介绍他们的模型和他们产生的结果。请注意,我们在这里特别提到计算结果,因为这些研究的行为结果已经包括在先前的研究工作中。

在Zaidel等人使用单线索条件下的感觉阈值来预测贝叶斯最优多感觉整合阈值。他们发现,在两个诊断组中,实验观察到的阈值与理论上预期的阈值相似。他们还使用了具有变化先验的贝叶斯推理模型的模拟来说明ASD的学习缺陷如何导致群体差异。

Karaminis等人使用从时间区分任务中估计的韦伯分数来计算参与者的似然方差。这些与时间再现任务中的偏差测量相结合,以估计先验精度,发现ASD的广泛先验和更大的可能性。他们还使用贝叶斯模型的模拟来证明,在自闭症谱系障碍中,先验范围比最优范围更广。它们没有考虑到辨别任务中可能的先验影响。Noel等人计算了方向估计任务中的预测偏差,作为参与者的Fisher信息的函数,Fisher信息是关于刺激编码信息的度量。Fisher信息使用两个自由参数建模:一个决定信息总量,另一个决定分配给先验分布与均匀刺激分布的资源。他们发现自闭症和神经正常的参与者之间的初始分配是相似的,在整个实验过程中,只有神经正常的参与者更新了编码资源的分配,以匹配刺激统计数据。他们还显示,ASD患者的Fisher信息总体上减少了。Powell等人使用了两项任务,参与者必须在每次试验中比较两种刺激的速度。在其中一项任务中,不同刺激物的对比有所不同,而在另一项任务中,移动的刺激物被呈现为静态或移动的参考点。研究人员认为,在不平衡假设下,在两个任务中,慢速先验方差与自闭症特征呈线性关系。他们最初分别计算了参与者在两种条件下的感知阈值,这些条件有不同的感官噪音。然后,他们通过比较来估计条件之间的主观相等点,并使用贝叶斯模型对它们进行拟合,其中先验宽度由自闭症特征调节:

添加图片注释,不超过 140 字(可选)

该模型优于仅基于先验的模型和仅基于感官证据的模型。这是该研究的主要发现,显示出较高的AQ值的平坦先验。

Pantelis和Kennedy使用了一项任务,参与者必须从照片中估计一个人的目光方向。他们在照片上叠加了一张房间的照片,期望环境线索会使参与者产生偏见。研究人员估计了在没有环境线索的情况下注视方向的可能性,然后使用贝叶斯模型估计了其他试验中线索的影响。该模型假设给定的注视方向,感知到注视方向的概率取决于预先计算的似然和图像显著性,并由自由参数加权。先前的权重在各组之间没有差异。

Karvelis等人在一个运动方向估计任务中,使用了一个具有学习先验的运动方向分布任务,该任务使用了一个贝叶斯模型,该模型假设了先验的一般(双峰)结构,并具有四个自由参数:模式位置、先验精度、似然/感官精度和一个表示参与者随机响应概率的参数。将该模型与其他贝叶斯和非贝叶斯模型进行了比较,结果表明该模型具有较好的性能。结果表明,随着AQ的增加,感官精度提高,但先验方差无显著差异。Noel等人在同时性判断任务中使用了类似的模型,其参数数量更多:先验强度、两个似然精度、感觉噪声和两个似然均值。其中一半参数的值是根据之前的结果固定的,剩下的另一半有待拟合。他们在自闭症参与者中显示出更强的耦合先验,但在其他参数上没有差异。Noel等人拟合了一个具有指数慢速先验的贝叶斯模型,用于角速度和径向速度,以及基于自运动的噪声测量的缩放方差的似然函数,从而得到四个自由参数。

为了模拟先验随着时间的发展,Manning等人使用了一个理想的贝叶斯学习器,它跟踪了试验t上的奖励概率(r)及其波动性(v),同时还估计了元波动性(k):

添加图片注释,不超过 140 字(可选)

所有参数都是根据任务信息估计的,因此模型没有自由参数。这与另外三种贝叶斯次优模型进行了比较,它在两个诊断组中都表现得更好。对于学习的量化,研究人员使用了一个简单的强化学习模型,该模型显示各组之间没有差异。

Angeletos Chrysaitis等人在概率决策任务中使用了循环推理模型。该模型结合每个试验的logit先验(Lp)和logit似然(L)来预测参与者的logit置信度估计(Le)如下:

添加图片注释,不超过 140 字(可选)

该模型有4个自由参数:先验和似然权重,先验和似然混响或重复计数。将其与包含先验和似然之间干扰的循环推理实现,更简单的加权贝叶斯模型和完美贝叶斯模型进行比较并优于循环推理实现。经过多次比较后,没有发现任何参数与诊断组或自闭症特征之间有统计学意义的关系。

三项研究利用层次高斯滤波器(HGF)对参与者的贝叶斯学习过程进行建模。他们都使用了一个三级HGF,其中第一级(x)对应于每个试验的对象(即,参与者被要求估计/回应什么),第二级(x2)对应于上下文线索和对象之间的耦合,第三级对应于环境的波动性(x3)。三级HGFs通常用以下公式形式化:

添加图片注释,不超过 140 字(可选)

自由参数是x和ω,它们决定波动性x3如何影响耦合强度,并表示元波动性或波动性随时间变化的程度。

Lawson等人在实施HGF时固定x=1,该HGF通过响应模型在对数反应时间上进行拟合,该模型有六个自由参数。将该模型与两种具有固定和动态学习率的简单强化学习模型以及两级HGF模型进行了比较,结果表明该模型表现较好。他们的结果显示,θ值增加,不同条件下第二级学习率的变化较小,而ASD的第三级学习率变化较大。Sapey-Triomphe等人使用相同的HGF,但概率地将其输出与前一试验的启动影响、前一模糊试验的感觉记忆和感觉输入结合起来。基于所有可能的耦合(HGF)、启动和感觉记忆组合,对8种模型进行相互比较。在看到每个刺激和随后的知觉反应之前做出的。获胜的模型只包括关联和启动,并有四个自由参数:ω,θ和关联和启动的组合权重。结果显示ASD的关联精度较低。Sevgi等人使用了固定=0的HGP版本,该版本整合了社交和非社交情境线索。它有6个自由参数:每个线索的x和o,它们的组合的权重参数,以及softmax响应函数的温度参数。这是在其他七种HGF和非HGF变体中获胜的模型,尽管HGF变体都没有非固定ω。该模型分别适用于两种任务条件下参与者的反应。结果显示,诊断组与实验条件对社会x值的影响存在双向交互作用,低智商被试的社会x值在不同条件下变化较大。

2.6.1贝叶斯模型:讨论

从理论上讲,贝叶斯模型有可能解决文献中观察到的一些矛盾,通过揭示简单的行为分析太粗糙而无法发现的细微差别。然而,在实践中,他们的发现同样好坏参半。一些研究没有显示出不平衡的证据,而另一些则支持不平衡的存在,其中一些研究显示出自闭症中强化先验的反向不平衡。学习模型大多找到有利于群体之间差异的证据,尽管这些证据不能简单地解释为不平衡假说的支持。

这些发现的异质性的一个可能的原因是模型本身的异质性。我们的所有研究都使用了不同的模型。计算方法从简单的模拟到多级贝叶斯学习器,从没有自由参数的模型到有八个自由参数的模型。此外,即使是类似的模型,在各种显式和隐式方面也存在差异。例如,虽然Sevgi等人和Lawson等人都使用了三级HGF,但他们各自固定了不同的参数,这使得他们选择的动机不明确。Karvelis等人的模型假设感知值是后验分布的均值,而Karaminis等人的模型则随机从后验中提取感知值,两者之间存在更细微的差异。在大多数文章中没有明确说明的另一个建模选择是围绕可能性的平均值。例如,Pantelis和Kennedy对具有相同刺激的所有试验使用相同的似然函数对任务数据进行建模。另一种选择是假设,由于感觉噪声,感觉输入来自以刺激为中心的分布,因此在每次试验中都是不同的。

最后,大多数研究不完全满足当前推荐的建模指南。具体来说,并非所有研究都测试了一个以上的模型,很少有研究探索贝叶斯框架的替代解释,只有一项研究进行了模型恢复,只有两项研究进行了参数恢复,只有少数人通过将模型的行为与实验观察到的数据进行比较来验证他们的模型。这是一个严重的限制,因为这些步骤对于理解建模结果的可靠性是必要的。

3. 讨论

在这篇全面的综述中,我们研究了所有实验研究自闭症谱系障碍的贝叶斯和预测编码理论。我们特别关注了失衡假说,即先前的信念对自闭症个体的感知和认知的影响较弱。这一假设描述了所有相关理论之间的共同结构。我们发现了各种各样的创新研究来探索这个问题假设使用神经成像,行为和计算手段。跨越知觉、决策和社会背景。

令人惊讶的是,大多数研究结果并不支持先验可能性失衡的存在。这与这些理论的流行形成鲜明对比,并反对失衡假设的广泛表述。然而,超过三分之一的研究提供了证据,证明减少了对ASD的先前影响。此外,我们的p曲线分析发现,研究结果具有证据价值,这表明不平衡也不能完全排除。不平衡假设的效应量相对较小。结果好坏参半的一个可能原因是,各种潜在机制可能导致了先验和可能性之间的不平衡。在整合过程中,自上而下的信号可能权重过低,自下而上的信号可能权重过高。另外,自闭症谱系障碍患者的整合能力可能是正常的,但由于学习缺陷,一些先验可能不太准确。另一方面,自闭症患者的可能性可能并不普遍狭窄,但根据感官信息的可靠性,适应性精度较低范德克鲁伊斯等人。

我们试图通过根据各自的先前类型对发现进行分类来解决一些含糊不清的问题。具体来说,在实验任务中形成的先验与参与者在实验前根据过去的经验期望获得的先验是分开的。然后,根据信息呈现给参与者的方式,将学习到的先验分为显性先验和隐性先验。既存先验也分为社会性先验和非社会性先验。我们发现,使用内隐学习先验的范式在支持失衡假说和支持ASD不存在失衡假说的结果中所占比例相等。这是展示了支持该假设的最有力证据的先验类型,紧随其后的是具有预先存在的社会先验的范式。这些结果暗示了自闭症中先验发展方式的损害。如果自闭症个体相对于神经正常的参与者需要更多的信息或时间来形成先验信念,那么当必须在有限的时间内提取环境规律时,两组之间的差异就会更明显。此外,可能的情况是,更复杂的社会先验更难以发展,因此学习障碍会不成比例地影响他们。“预测”任务的反应可能直接来自参与者的先验,也为先验习得的差异提供了证据。如果这是自闭症中精确度失衡的来源,未来的研究将需要澄清这种损害是源于对长期统计数据的学习,还是仅仅使用了最近的试验。

我们发现,发表的行为研究比神经影像学研究更容易导致无效结果。一种可能的解释是,神经成像方法不仅测量了先验的影响,而且还测量了相关但不同的大脑过程的差异。例如,它们可能对应于在先验可能性整合之后发生的注意力转移或更新过程。一种截然相反的解释是,自闭症参与者利用替代策略来弥补减少的先前影响。在这种情况下,他们的行为表现将是相似的,但神经成像测量将揭示潜在的补偿机制。这一解释也可以解释为什么具有明确学习先验的设计经常显示无效结果,尽管前面提到的自闭症可能存在学习障碍。用AQ代替ASD诊断的研究也经常导致无效结果,这引发了对自闭症维度视图的质疑。值得注意的是,研究在如何选择神经典型样本方面并不总是一致的,例如,如果他们临床验证神经典型参与者不是自闭症,或者如果他们包括AQ切断。

新的证据,特别是环境波动的处理。该理论接受可能性和先验精度之间存在不平衡的可能性,但其重点是这种不平衡如何影响信念的贝叶斯更新,而不是对特定刺激的推断。Lawson等人进行了一项支持这种方法的开创性研究,该研究表明ASD的元波动率增加,或者波动率的估计随时间变化的程度。然而,随后使用类似模型的研究并没有重现这一发现,而是发现条件和群体之间存在复杂的相互作用效应,或者相关模型参数没有差异。值得注意的是,没有研究使用完全相同的模型实现。具有类似焦点的非建模研究表明,ASD患者在不稳定条件下的表现更差,在可变性变化后,眼动追踪测量的变化更小。目前还不清楚这些发现揭示了自闭症患者的易变过程。

另一个有希望的理论可能是失衡假说的具体表述,称为自闭症预测误差的高、不灵活精度。HIPPEA提出,自闭症的可能性精度并不都很高。相反,精度不能根据刺激和环境灵活地改变,即使在次优情况下也保持较高。这可能是研究结果可变性的一个来源:只有当神经正常或低aq的参与者对感觉信息分配足够低的精度时,才会观察到差异,否则就不会。该理论还关注先验发展,强调如何将同样过高的精度分配给所有感官输入,将导致受噪音影响的先验,并且不太可能广泛使用。一些研究试图直接研究这一理论,但同样没有明确的结论。

从方法论的角度来看,83项研究中只有13项使用贝叶斯模型来分析他们的行为数据。虽然计算模型理论上应该提高研究结果的清晰度,但这些研究中使用的模型非常多样化,从简单的模拟和群体水平模型到描述个体差异的分层学习模型。从整体上看,这些研究得出了不同的结果,既支持也反驳了失衡假说。由于模型的多样性和缺乏研究内模型比较,尚不清楚结果的差异是源于计算技术的差异还是任务设计的差异。

2021年发表的一篇相关的系统综述也试图了解ASD的预测障碍,尽管只关注自闭症个体。他们的方法在理论基础上与我们的方法不同,因为它在很大程度上依赖于自闭症预测障碍假说,而不是贝叶斯公式。它还包括了一个完全不同的文章库,他们的47项研究中有25项没有被纳入我们的研究库,我们的61项研究没有被纳入他们的研究库。作者根据“预测基础”将研究分为7类,其中包括我们的广泛先验类别和我们的分段分组(例如,学习先验,显性先验,社会先验,频率先验,线索关联)。他们还根据“预测证据”将研究分为11类,即研究人员测量的反应类型(例如,特定的神经成像测量、适应、反应时间)。这极大地展示了文学的异质性,这也是我们一直在努力解决的问题。他们的结论确实部分反映了我们自己的结论,即在自闭症谱系障碍中发现了预测关联的学习障碍。那篇综述的另一个结论是,自闭症患者在大脑中的低级预测处理方面存在差异,这主要来自于习惯化和适应研究。

3.1 文献的局限性

首先,在这篇综述中,我们决定将贝叶斯和预测编码方法组合在一起。之所以做出这样的选择,是因为大多数研究没有区分这两种框架,尽管它们不一定一致。理论框架之间的混淆也以更广泛的方式存在。自闭症的多种理论似乎都有相同的基本组成部分。弱中央一致性,增强知觉功能,以及一般的局部/全局处理失衡与贝叶斯或预测编码理论具有相同的基本结构,因为它们都认为自闭症个体超重的是自下而上的特定信息,而不是自上而下的一般信息。此外,自闭症的预测性障碍也提出,这些个体在学习环境的概率关联方面存在困难。我们如何区分这些理论?它们都是相同基本机制的表述吗?如果是,用贝叶斯术语来解决这个问题的额外好处是什么?从其他形式的自上而下/自下而上的不平衡中区分出弱化的先验或过于精确的可能性是非常困难的,大多数被审查的研究没有为他们选择的解释提供任何理由,这一事实大大加剧了这种不平衡。接下来的问题是关于先验信念有多复杂或抽象。例如,我们是否应该期望由简单频率信息组成的先验在线索整合中由不同的机制产生,而不是耦合先验或与上下文线索的关联。

如果没有大脑中先验层次的清晰框架,以及在计算模型中可能实现的框架,这些模糊性就无法解决。尽管如此,只有很少的研究使用理论驱动模型,更少的研究进行模型比较,以确保他们选择的模型是对数据的最佳描述。更糟糕的是,不同研究的模型差异很大,让读者无法比较他们的发现。同样令人惊讶的是,计算建模的推荐指南往往没有得到完全遵循,几乎所有的研究都忽略了参数和模型恢复。最后一个重要的问题是,大多数研究没有进行功率分析,并且使用了小样本量,导致调查不平衡假设的研究的估计统计功率为42%,总体为39%。不幸的是,低功耗在认知和生物医学科学中很常见。我们发现,在我们的研究池中,成像研究的功率略高于相关领域,但行为研究的功率较低,可能是因为我们的池中的效应量较低。低统计能力对他们的发现的可重复性提出了严重的问题,因为它是可重复性危机的主要因素之一。它还会导致对效应大小的高估,并为综合研究结果得出的任何结论增加噪音。没有对我们的研究进行精确的复制。

3.2 本研究的局限性

我们回顾的最大限制在于我们在分析过程中的自由度。由于研究人员通常不清楚他们如何概念化他们的设计所测量的先验,我们不得不根据自己的理解来解释和分类它们。我们的选择取决于我们对实验的理解和研究人员的分析精神。然而,在这个过程中,我们并没有对研究结论视而不见,因为这些在研究摘要中都有提到。从理论上讲,这可能会在我们的分类过程中引入偏见。我们无法让独立的审稿人评估每项研究,这将最大限度地减少我们偏倚的可能性。

本综述的结论来自对研究结果的概述和使用粗略的汇总统计。鉴于所提供的统计数据,不可能进行荟萃分析。此外,文献中用于评估先验可能性不平衡的措施和技术的异质性意味着没有一个数字可以概括现有的证据。这篇综述的另一个限制是,我们根据发展和先验类型对范式进行了分类,但是每个范式的类别选择远非微不足道。我们分类的不完善可能是缺乏明确结论的另一个原因。最后,考虑到我们文献检索的范围,各种研究并没有被简单地根据关键词的选择和研究者提供的解释纳入本综述。这意味着可能具有贝叶斯含义的研究或甚至与我们选择的研究设计相同的研究未被纳入本综述。

3.3 结论及未来研究方向

自2012年Pellicano和Burr发表开创性文章以来,10年来有许多研究对贝叶斯和预测编码理论进行了研究。虽然这项研究的广度令人印象深刻,但将所有的发现综合成一个连贯的整体已被证明是一项几乎不可能完成的任务。这些研究的结果好坏参半,有时还相互矛盾。为了使实验证据有意义,我们根据它们的先验发展方式对研究进行了分类。这揭示了一种倾向,即在整个实验过程中所学到的先前知识被削弱,而先前的知识完好无损。当直接从先验中提取答案时,它也显示出一些差异。这些结果可能表明,自闭症的特征不是贝叶斯先验整合的普遍缺陷,而是先验发展的缺陷。我们还显示了非常小的效应大小,特别是对于先前存在的先验,并且显著低的统计能力。这些因素,再加上研究结果的可变性,使得任何结论都不确定。

根据我们的审查,我们建议后续研究遵循以下准则:

1. 如果研究人员解释他们如何在实验背景下概念化先验/预测和可能性/预测误差,他们的组合预期会产生什么影响,以及不平衡将如何在数据中表现出来,那么在一项研究中可以获得更多的清晰度。理想情况下,这将伴随着图表和方程式来描述在观察到的发现的基础上提出的机制。

2. 在可能的情况下,应使用贝叶斯/预测编码计算模型来分析研究结果。a.将这些模型与非贝叶斯模型进行比较可以证实贝叶斯方法的有效性,而与其他贝叶斯模型进行比较可以支持他们对模型结构的准确选择。b.同样重要的是,进行模型和参数恢复以验证模型估计的可靠性,以及验证模型能够重现数据中的相关模式。

3.预先登记假设、实验设计和分析是一种有用的工具,可以限制解释结果时使用的自由度,并最大限度地减少对积极发现的偏见。

4. 在功率分析的推动下,样本量应该增加。

5. 在整个实验过程中,试图测量先验习得和先验可能性失衡的研究可以澄清失衡的结果是源于学习差异还是源于整合差异。

我们相信,将计算方法纳入精神病学可以极大地帮助我们理解自闭症和其他精神障碍。然而,该领域目前还很年轻,相对不成熟,这从研究的异质性和分析和解释结果缺乏正式结构两方面都可以看出。我们的建议可以为后续的研究提供一些必要的严谨性,可能有助于未来对自闭症的理解。

参考文献:10 years of Bayesian theories of autism: A comprehensive review.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档