来源:《中国人工智能学会通讯》2017年第5期
科技前沿
CAAI 2017年 第7卷 第5期史忠植
心智模型CAM的
学习记忆机制
智能科学是当代脑科学、认知科学、人工智能等的前沿交叉学科,研究智能的理论和技术,其核心问题之一是构建心智模型。心智模型 CAM(Consciousness And MemoryModel)是一种通用智能系统架构。本文主要介绍心智模型 CAM 的学习记忆机制,重点讨论记忆的生理基础、互补学习系统、学习记忆进化等问题。
心智模型 CAM
心智 (mind) 是人类全部精神活动 , 包括情感、意志、感觉、知觉、表象、学习、记忆、思维、直觉等;心智是指一系列认知能力组成的总体,这些能力可以让个体具有意识、感知外界、进行思考、做出判断以及记忆事物。用现代科学方法来研究人类非理性心理与理性认知融合运作的形式、过程及规律。建立心智模型的技术常称为心智建模,目的是为了从某些方面探索和研究人的思维机制,特别是人的信息处理机制,同时也为设计相应的人工智能系统提供新的体系结构和技术方法 [1]。
在心智活动中,记忆和意识起着最为重要的作用。记忆存储各种重要信息和知识;意识让人有自我的概念,能根据需求、偏好设定目标,并根据记忆中的信息进行各种认知活动,因此提出基于记忆和意识的心智模型 CAM[2]。图 1 给出了 CAM 的系统结构,主要由 5 部分组成,即记忆、意识、高级认知功能、感知输入、行为响应。每部分的功能和原理简单介绍如下所述。
图 1 CAM 的系统结构
1. 记忆
记忆就是对过去的经验或是经历,在脑内产生准确的内部表征,并且能够正确、高效地提取和利用它们。记忆涉及信息的获得、储存和提取等多个过程,这也就决定了记忆需要不同的脑区协同作用。在最初的记忆形成阶段,需要脑整合多个分散的特征或组合多个知识组块以形成统一的表征。从空间上讲,不同特征的记忆可能储存于不同的脑区和神经元群。在时间上,记忆分为工作记忆、短时记忆和长时记忆。对记忆过程的控制和相关的神经机理,已经成为热点科学问题。深入研究记忆的神经生理学机制,可以提高人对自身智能活动的认识,同时也会为有效智能信息处理系统的建立提供理论基础或借鉴。
2. 意识
意识是生物体对外部世界和自身心理、生理活动等客观事物的觉知。意识是智能科学研究的核心问题之一,意识的脑机制是各种层次的脑科学共同研究的对象。人类进行意识活动的器官主要是脑。为了揭示意识的科学规律,建构意识的脑模型,不仅需要研究有意识的认知过程,而且需要研究无意识的认知过程,即脑的自动信息加工过程,以及两种过程在脑内的相互转化过程。同时,自我意识与情境意识也是需要重视的问题。自我意识是个体对自己存在的觉察,是自我知觉的组织系统和个人看待自身的方式,包括自我认知、自我体验、自我控制三种心理成分。情境感知是个体对不断变化的外部环境的内部表征。在复杂、动态变化的社会信息环境中,情境感知是影响人们决策和绩效的关键因素。意识的认知原理、意识的神经生物学基础以及意识与无意识的信息加工等是需要重点研究的问题。
3. 高级认知功能
脑的高级认知功能包括学习、记忆、语言、思维、决策、情感等。学习是通过神经系统不断接受刺激,获得新的行为、习惯和积累经验的过程。而记忆是指学习得到的行为和知识的保持和再现,是我们每个人每天都在进行着的一种智力活动。语言和高级思维是人区别于其他动物的最主要因素。决策是指通过分析、比较,在若干种可供选择的方案中选定最优方案的过程,也可能是对不确定条件下发生的偶发事件所做的处理决定。情感是人对客观事物是否满足自己的需要而产生的态度体验。
4. 感知输入
人的感觉器官包括视觉、听觉、触觉、嗅觉、味觉。在 CAM 模型中重点考虑视觉和听觉。视觉系统使生物体具有视知觉能力。人类的视觉皮层包括初级视皮层(V1,亦称纹状皮层)以及纹外皮层(V2、V3、V4、V5等)。初级视皮层位于 17 区。纹外皮层位于 18 区和 19 区。
听觉通路包括外耳、中耳、内耳、听神经及听觉中枢。听觉通路在中枢神经系统之外的部分称为听觉外周,在中枢神经系统内的部分称为听觉中枢或中枢听觉系统。听觉中枢纵跨脑干、中脑、丘脑的大脑皮层,是感觉系统中最长的中枢通路之一。
感觉缓存又称感觉记忆或瞬时记忆 , 是感觉信息到达感官的第一次直接印象。感觉缓存只能将来自各种感官的信息保持几十到几百毫秒。在感觉缓存中 , 信息可能受到注意 , 经过编码获得意义 , 继续进入下一阶段的加工活动,如果不被注意或编码,它们就会自动消退。
5. 行为响应
行为响应包括动作选择和响应输出。动作选择是指由原子动作构建复杂组合动作,以实现特定任务的过程。动作选择机制可以基于基底神经节模型实现。
响应输出从总体目标开始运动分级,受外周区域输入的情感和动机的影响。基于控制信号,初级运动皮层运动区直接生成肌肉的运动,实现某种内部给定的运动命令。
记忆的生理基础
一般认为,记忆的生理基础与新皮质和海马有关。端脑表面所覆盖的灰质称为大脑皮质。依据进化 , 大脑皮质分为古皮质 (archeocortex)、旧皮质 (paleocortex) 和新皮质。古皮质和旧皮质与嗅觉有关 , 是三层的皮质,总称为嗅脑。人类新皮质高度发达 , 约占全部皮质的 96%。新皮质发展成为六层,如图 2 所示。第一层是皮质内部神经元投射信息交汇的地方。底下 L2/3和 L5 层的锥体细胞投射上来轴突和顶树突,在这里交汇,这里的神经元细胞很少,其中大部分都是抑制性的。L2/3 层有各种神经元,主要是小椎体细胞,构建皮质内的局部回路,这些锥体细胞主要连接是在皮质内部,但也有连到胼胝体的。L4 主要是颗粒性细胞,胞体较小而密集,负责接收丘脑传递的感觉信号。L5 主要负责传出信号,包含了最大的椎体细胞,将轴突投射到其他不同的脑区。L6 也是主要负责传出信号,但也接收丘脑传入的反馈信号。
图 2 新皮质的分层结构
新皮质记忆结构化的知识,存储在新皮质神经元之间的连接中。当多层神经网络训练时,逐渐学会提取结构,通过调整连接权值,使网络输出的误差最小化,成为相对稳定的长时记忆。
海马体是大脑内部一个大的神经组织,它处于大脑半球内侧面皮质和脑干连接处。海马体由海马、齿状回(dentate gyrus,DG)和海马台组成。海马呈层形结构,没有攀缘纤维,而有许多侧枝。构成海马的细胞有两类,即锥体细胞和蓝细胞。在海马中,锥体细胞的细胞体组成层状并行的锥体细胞层,它的树突是沿海马沟的方向延伸。蓝细胞的排列非常有序。图 3 给出了海马体的构造。
图 3 海马体的构造
海马区在存储信息的过程中扮演着至关重要的角色。短时记忆储存在海马体中。如果一个记忆片段,比如一个电话号码或者一个人的信息在短时间内被重复提及的话,海马体就会将其转存入大脑皮质,成为长时记忆。存入海马体的信息如果一段时间没有被使用的话,就会自行“删除”,也就是被忘掉了。而存入大脑皮质的信息也并不是完全永久的,当你长时间不使用该信息的话,大脑皮质也许就会把这个信息给“遗忘”掉。有些人的海马体受伤后就会出现失去部分或全部记忆的状况。记忆在海马体和大脑皮质之间的传递过程要持续几周,并且这种转递可能在睡眠期间仍然进行。
一些研究者运用 PET 技术来研究与陈述性记忆或外显记忆有关的大脑结构。当被试完成陈述性记忆任务时,右侧海马的脑血流量要比完成程序性记忆任务时的更高一些。这一发现是支持海马结构在陈述性记忆中起到重要作用的观点。
互补学习系统
根据马尔(David Marr)早期的想法 [3],斯坦福大学心理学教授麦克莱伦德(James L.McClelland)于 1995 年提出了互补学习系统(complementary learning systems,CLS)理论[4]。该理论认为人脑学习是两个互补学习系统的综合产物,一个是大脑新皮质学习系统,通过接受体验,慢慢地对知识与技能进行学习;另一个是海马体学习系统,记忆特定的体验,并让这些体验能够进行重放,从而与新皮质学习系统有效集成。
2016 年, 谷 歌 深 度 思 维 的 库 玛 拉(Dharshan Kumaran)、 哈 萨 比 斯(DemisHassabis)和斯坦福大学的麦克莱伦德在《认知科学趋势》刊物上发表文章 [5], 拓展互补学习系统理论。大脑新皮质学习系统是结构化知识表示,而海马体学习系统则迅速地对个体体验的细节进行学习。文章对海马体记忆重放的作用进行了拓展,指出记忆重放能够对体验统计资料进行目标依赖衡量。通过周期性展示海马体踪迹,支持部分泛化形式,新皮质对于符合已知结构知识的学习速度非常迅速。最后,文章指出了该理论与人工智能的智能体设计之间的相关性,突出了神经科学与机器学习之间的关系。
图 4 给出大脑半球的侧视图。其中虚线表示大脑内或深处的区域内侧表面,主要感觉和运动皮质显示为深黄色。内侧颞叶(medialtemporal lobe,MTL)包围虚线,海马以深灰色和周围的内侧颞叶(MTL)皮质浅灰色(大小和位置是近似的)。绿色箭头表示整合的新皮层关联区域内之间,以及在这些区域和模态特定区域之间的双向连接。蓝色箭头表示新皮质区域和内侧颞叶(MTL)之间的双向连接。蓝色和绿色连接是互补学习系统理论中结构敏感的新皮质学习系统的一部分。内侧颞叶内的红色箭头表示海马内的连接,浅红色的箭头表示海马之间的连接和周围的内侧颞叶(MTL)皮质:这些连接表现出快速突触可塑性,这对将事件的元素快速结合成整合的海马表示非常重要。系统级合并涉及重播期间通过用蓝色箭头指示的途径扩散到新皮质关联区域的海马活性,从而支持在新皮质内连接(绿色箭头)内的学习。系统级合并是在记忆检索时完成,重新激活相关的新皮质表示集成,可以在无海马情况下完成。
图 4 大脑半球的侧视图
图 5 给出海马子区域、连通性和表示示意图,其中圆形或三角形表示神经元细胞体,红色线条表示高可塑性突触的投影,而灰色显示相对稳定的可塑性突触的投影。互补学习系统理论框架内的工作依赖于内侧颞叶(MTL)分区的生理特性。在体验期间,来自新皮质的输入在内嗅皮质(entorhinalcortex,ERC)中产生激活的模式,可以被认为是压缩描述的贡献皮质区域中的模式。图5 中内嗅皮质的说明性活动神经元以蓝色显示。内嗅皮质神经元产生投射到海马体的三个分区, 即 DG、CA1 和 CA3。
图 5 海马的子区域、连通性和表示的示意图
海马体学习系统实现模式选择和模式分离。新的内嗅皮质 (ERC) 模式激活一组以前未提交的 DG 神经元,图 5 中显示红色,这些神经元可能是相对年轻的神经元,通过神经发生创建。这些神经元,反过来,通过大的“引爆突触”选择 CA3 中的神经元的随机子集。在从 DG 投影到 CA3 表示为红点,用作 CA3 中的记忆表示,确保新 CA3 模式与用于其他记忆的 CA3 模式尽可能不同,包括用于经验的模式,类似于新的经验。来自活动的 CA3 神经元反复连接到其他活动 CA3神经元上,表示体验增强,使得相同神经元的子集稍后变为活动,其余的模式将被重新激活。从 ERC 到 CA3 的直接连接也得到加强,允许 ERC 输入在检索期间直接激活 CA3中的模式,而不需要 DG 参与。
从 ERC 到 CA1 和背部的连接改变相对缓慢,允许 CA1 和 ERC 之间的模式相对稳定对应。在记忆编码期间,当 CA1 模式与相应的 CA3 模式被重新激活时,从活动的 CA3神经元到活动的 CA1 神经元连接加强。从CA1 到 ERC 的稳定连接则允许适当的模式有待重新激活, ERC 和新皮质区域之间稳定的连接传播模式到大脑皮层。重要的是,CA1和 ERC 之间,以及 ERC 和新皮质之间的双向投影,支持内嗅皮质和新皮质模式的可逆CA1 表示的形成和解码,并允许重复计算。这些连接不应该快速改变给定的记忆中海马的扩展作用,否则在海马中存储的记忆在新皮质中难以恢复。
图 6 解释海马的连接编码、模式分解和合成。图 6 (A) 给出有 5 个输入端连接 10 个输出端,每个输出端连接 2 个不同模式的输入。每个连接单元检测相邻输入单元的活动。DG 可以使用高阶的连接,放大这些影响。图6 (B) 说明模式分离函数的一般形式,显示在输入和输出之间的关系重叠;箭头表明图6(A)中输入和输出的重叠。图 6(C) 表示模式分解和合成的情况与 CA3 相关,在那里输入低的重叠减小少,而较高的输入重叠减小多。
图 6 连接的编码,模式分解和合成
模式分解和合成是根据影响神经活动模式之间的重叠或相似性的变换来定义的。模式分解使得类似模式通过连接编码更清晰,其中每个输出神经元仅响应于有效输入神经元的特定组合。图 6(A)和(B)显示了这种情况如何发生。模式分解是在 DG 中实现的,使用高阶连接减少重叠。
模式合成是一个过程,需要采集模式的片段和填补其余的功能。采取与熟悉模式相似的模式,使它更加类似于它。计算模拟已经表明 ,CA3 区域组合分离的模式特征和合成,使得中等和高度重叠,导致模式合成并保存在记忆中, 而重叠较少的模式导致创建一个新的记忆,如图 6(C)所示。这种情况下,当环境输入在 ERC 中产生类似于先前模式的模式时,CA3 输出更接近其先前用于该在 ERC 模式的模式。然而,当环境在 ERC上产生与以前记忆模式重叠低的输入时,DG在 CA3 中创建新的、统计独立的细胞群。新出现的证据建议模式合成(以及海马处理的其他特征)所需的重叠量可以发生在海马近端末梢和背腹侧轴,并可能由神经调节因子(如乙酰胆碱)形成。
研究指出,CA3 和 CA1 分区之间的差异在于其神经活动模式对环境变化的响应。广义上讲,CA1 分区倾向于反映来自在 ERC 的输入重叠程度,而 CA3 更多显示反映模式分解或合成的不连续响应。
学习记忆的进化
为适应外界而改变自身结构的进化,是世界上最重要的机理之一。进化、学习、记忆,再经过高级的进化、学习与记忆的进化,产生了目的性,这个实际上是一个关键,随机的无目的的机器能通过学习去探索其本身的目的 [6]。19 世纪中叶,达尔文创立了生物进化学说。生物通过遗传、变异和自然选择,从低级到高级,从简单到复杂,种类由少到多地进化着、发展着。
对智力来说,所谓的进化是指学习的学习,这个学习的学习跟软件不同,它是记忆的结构也跟着变化,这是很重要的一条,而且结构变化把学习的结果记录下来,还改进了学习方法。要使机器具有人类水平的智能,必须让机器具有学习与记忆进化的功能。通过学习不仅增长知识,而且使机器的记忆结构发生变化。
俗话说“活到老学到老”,学习是永无止境的。2015年,美国卡内基梅隆大学(CMU)米切尔等提出了“永无止境的学习”[7]。作为案例研究,他们开发了永无止境的语言学习机(NELL), 它的系统结构如图 7 所示。自从 2010 年 1 月以来,NELL 一直从互联网上阅读学习, 每天学习 24 小时。到 2015 年1 月为止, NELL 已经拥有 8 000 多万人的知识库,已经学到了数百万项功能和参数,学会推理新的知识,通过合成新的关系谓词来扩展其本体。
图 7 NELL 的系统结构
2017 年, 美 国 国 防 高 级 研 究 计 划 局(DARPA)提出了“终身学习机(LifelongLearning Machines,L2M)”计划 [8],该计划的目标是开发新一代机器学习技术,可以从新的情况中学习,并使学习效果更好、更可靠。终身学习机计划有两个技术领域。第一个旨在开发机器学习框架,可以不断应用过去经验的结果,并将“经验训练”适应新的数据或情况;同时,它要求开发监测机器学习系统行为的技术,设定其适应能力范围的限制,并根据需要干预系统的功能。研究将包括网络理论、算法、软件和计算机体系结构。第二个技术领域是生物学习机制,生命系统如何学习和适应,并将这些原理和技术应用到机器学习系统中。
参考文献
[1] Z. Shi, “Intelligence Science”, World Scientific Publishing Co Pte Ltd, 2012.
[2] Z. Shi, “Mind Computation”, World Scientific Publishing Co Pte Ltd, 2017.
[3] D. Marr , “Simple memory: a theory for archicortex. Philos. Trans. R. Soc. L. B Biol. Sci. 262, 23-81, 1971.
[4] J. L. McClelland, et al., “Why there are complementary learning systems in the hippocampus and neocortex: insights from the successes and failures of connectionist models of learning and memory”, Psychol. Rev. 102, 419-457, 1995.
[5] D. Kumaran, D. Hassabis, J. L. McClelland, “What Learning Systems do Intelligent Agents Need? Complementary Learning Systems Theory Updated”, Trends in Cognitive Sciences, Vol. 20, No. 7: 512-534, 2016.
[6] 史忠植 . 突破通过机器进行学习的极限 [J]. 科学通报 , 61 (33): 3548-3556, 2016.
[7] T. Mitchell, W. Cohen, E. Hruschka, et al., “Never-Ending Learning”, Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), January 2015.
[8] DARPA, “Toward Machines that Improve with Experience” http://www.darpa.mil/news-events/2017-03-16.
作者介绍:史忠植
中国科学院计算技术研究所研究员。中国计算机学会会士,中国人工智能学会会士,IFIP 人工智能机器学习和数据挖掘组主席 , IEEE 高级会员,AAAI、ACM 会员。曾荣获国家和部门科技奖项 6 项。2013 年获得中国人工智能学会吴文俊人工智能科学技术成就奖。发表著作 16 本,发表学术论文 500 多篇。曾担任中国计算机学会秘书长,中国人工智能学会副理事长。主要研究方向为智能科学、人工智能等。
微信号:CAAI-MemberCenter
CAAI会员中心
领取专属 10元无门槛券
私享最新 技术干货