作者:黄振业,中国科学院理论物理研究所2022级博士研究生
导师:周海军 研究员
方向:统计物理与复杂系统
预测编码
我们的神经系统时刻接收着大量感官信息,但它并非只是一个被动的接收器。相反,它更像一个“预言家”,不断预测外界环境发生的事情!这就是神经科学中的一个重要理论——预测编码(Predictive Coding)。预测编码最初源于信号处理技术,后被引入神经科学,揭示了大脑感知世界的机制。其核心观点是:神经系统在感知环境信号时会主动预测,而非被动接收。以下两个例子能帮助我们感受到这种预测机制的存在。
(1)不存在的正方形
图1:Kanizsa正方形错觉[1]。
上图中似乎存在一个白色正方形?但实际上只有四个带有缺口的圆盘。然而,基于以往看到正方形轮廓的经验,我们的大脑主动预测并补全了这个形状。
(2)在前方还是在后方?
图2:Flash-lag错觉[2]。
在上图中,绿色点似乎出现在红色点运动轨迹后方(左方)。实际上,绿色点实际出现的位置比红色点位置超前,但被感知为滞后。这是因为我们的大脑对红点的位置进行了预测,提前感知到红色点的位置,而对闪烁的绿色点的响应较慢,从而产生错觉。
1. 视网膜中的预测编码
预测编码被引入神经科学时,首先用于视网膜编码的建模。
如下图所示,自然图像中相近像素的关联度很高,这意味着相邻像素通常非常相似。一个像素的亮度很大程度上可以被周围像素预测。
图3: 自然图片以及水平方向上不同像素距离的关联函数。
如果视网膜把所有像素信号全都传给大脑,消耗巨大且效率太低。预测编码提供了一个解决方案:只编码“意外”,即预测误差。考虑某一个像素点的值为
,其周围
个像素点的值
,
, ...,
,可对
进行预测,
预测误差为,
最小化预测误差,可以得到最优的
。上面的尖括号表示对所有数据进行平均。视网膜上的预测编码模型解释了实验观察到神经元响应的弱相关性现象,以及中心-周围感受野现象。
中心周围感受野指的是,刺激神经元感受野中心光感受器会使得神经元响应增强,而刺激周围的光感受器反而会使得神经元的响应减弱的现象。通过最优化预测误差得到的
反映了该性质。
图4: 选自[5]。(a)On-center中心周围感受野示意图,刺激感受野中心神经元响应加强,刺激周围神经元响应减弱。(b)水平方向的权重
,反映了中心-周围感受野的性质。
上述例子为空间上的预测,实际上在时间上也可以进行类似的预测编码,在此不去赘述。
层级预测编码
大脑的信息处理存在层级结构,高层级神经元对低层级神经元具有反馈调节作用。预测编码理论因此扩展至层级结构。高层级神经元对低层级神经元进行预测,并调节其响应。其处理信息的框架如图所示。
图5: 层级预测编码示意图。
用向量
表示第
层神经元的活动,则该层神经元对
层的神经元活动会进行预测,其形式可以写成,
其中,
为第
层神经元的预测,
为预测误差,
为一个函数,
为预测矩阵。总的预测误差为,
在这样一个层级网络中,神经元的动力学以及神经元的学习法则可以从最小化预测误差得到,
为什么高层级的神经元能够对低层级的神经元活动进行预测呢?高层级神经元相比于低层级神经元能够接收到更多信息,利用得到的信息可以对低层级神经元的活动进行预测。层级预测编码成功地解释了神经系统中存在的非经典感受野现象。
图6:非经典感受野示意图[6]。
如上图为情景效应,中间区域为神经元感受野。当感受野外围的刺激模式与中心区域一致时(上图),神经元的响应会被预测到,神经元响应减弱(下图);当感受野外部的输入与感受野内部的刺激模式不同时,神经元响应则更强。
方兴未艾的预测编码理论
随着研究的推进,预测编码被应用到更真实的脉冲神经网络;其理论框架也被推广到自由能原理;在功能解释上,预测编码成为理解感知、注意力和空间认知等高级认知功能的机制之一;在编码性质上,预测编码系统展现出丰富的相变现象。预测编码为理解大脑智能提供了新的视角,这一充满活力的理论将继续引领我们深入探索大脑这一“预测机器”的奥秘。
参考文献
1. Pang Z, O’May C B, Choksi B, et al. Predictive coding feedback results in perceived illusory contours in a recurrent neural network[J]. Neural Networks, 2021, 144: 164-175.
2. 维基百科https://en.wikipedia.org/wiki/Flash_lag_illusion
3. Jiang L P, Rao R P N. Dynamic predictive coding: A model of hierarchical sequence learning and prediction in the neocortex[J]. PLOS Computational Biology, 2024, 20(2): e1011801.
4. Srinivasan M V, Laughlin S B, Dubs A. Predictive coding: a fresh view of inhibition in the retina[J]. Proceedings of the Royal Society of London. Series B. Biological Sciences, 1982, 216(1205): 427-459.
5. Huang Y, Rao R P N. Predictive coding[J]. Wiley Interdisciplinary Reviews: Cognitive Science, 2011, 2(5): 580-593.
6. Rao R P N, Ballard D H. Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive-field effects[J]. Nature neuroscience, 1999, 2(1): 79-87.
7. Brendel W, Bourdoukan R, Vertechi P, et al. Learning to represent signals spike by spike[J]. PLoS computational biology, 2020, 16(3): e1007692.
8. Friston K J, Stephan K E. Free-energy and the brain[J]. Synthese, 2007, 159: 417-458.
9. Spratling M W. Predictive coding as a model of biased competition in visual attention[J]. Vision research, 2008, 48(12): 1391-1408.
10. Tang M, Barron H, Bogacz R. Learning grid cells by predictive coding[J]. arXiv preprint arXiv:2410.01022, 2024.
11. Spratling M W. Predictive coding as a model of cognition[J]. Cognitive processing, 2016, 17: 279-305.
12. Huang Z Y, Zhou R, Huang M, et al. Energy-information trade-off induces continuous and discontinuous phase transitions in lateral predictive coding[J]. Science China Physics, Mechanics & Astronomy, 2024, 67(6): 260511.
13. Huang Z Y, Wang W, Zhou H J. Discontinuous phase transition of feature detection in lateral predictive coding[J]. arXiv preprint arXiv:2501.12139, 2025.
领取专属 10元无门槛券
私享最新 技术干货