首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >具身认知与激进具身认知(2)

具身认知与激进具身认知(2)

作者头像
CreateAMind
发布2026-03-11 18:14:55
发布2026-03-11 18:14:55
1170
举报
文章被收录于专栏:CreateAMindCreateAMind

Embodied Cognition and Radical Embodied Cognition(2)

具身认知与激进具身认知

https://uberty.org/wp-content/uploads/2015/03/Anthony-Chemero-Radical-Embodied-Cognitive-Science-Bradford-Books-2009.pdf

《激进具身认知科学》(Radical Embodied Cognitive Science第二章 “Embodied Cognition and Radical Embodied Cognition”核心重点概述,基于原文内容整理而成,突出理论定位、关键区分与实例论证逻辑:


🔹 章节主旨

阐明 “激进具身认知科学”(RECS)的理论内涵、历史渊源与科学实践特征,将其与主流“具身认知科学”(Embodied Cognitive Science, ECS)明确区分开来,并通过两个典型案例回应其核心批评——尤其是关于“表征是否必要”的根本争议。


🔸 一、核心定义与三重主张

RECS 的正式定义(作者自定义):

对知觉、认知与行动作为“必然具身现象”所开展的科学研究,其采用的解释工具不预设心理表征(mental representations)。 即:一种无需“心智体操”的认知科学

其理论立场可概括为三项主张:

  1. 否定主张:表征性与计算性的心智观是错误的;
  2. 方法论主张:认知应通过特定工具集 T(如动力系统理论)加以解释;
  3. 本体论承诺:工具集 T不预设心理表征

✅ 作者强调:主张2 + 主张3 = RECS 的科学实践;主张1虽被认可,但非本书论证重点。


🔸 二、历史定位:并非“激进化的ECS”,而是ECS的“稀释版”

  • RECS 的思想谱系: 源自 美国自然主义(James → Dewey)→ 吉布森生态心理学反表征主义传统(Brooks, Barwise & Perry 等)。 → 本质是 消除论(eliminativist root and branch)。
  • ECS 的定位: 并非RECS的温和版本,而是对RECS的折中与稀释—— 保留“具身性”与“动力学解释”价值,却嫁接进计算主义心智观(computational theory of mind),从而放弃其反表征主义核心

📌 关键洞见

RECS 不是ECS + 反表征主义; ECS 是RECS + 计算主义妥协。 → 因此,举证责任应落在ECS一方:它需证明“自然主义 × 计算主义”的杂合模型是否真正稳固(stable)。


🔸 三、核心分歧:表征在解释中的角色

批评者(如Clark)常误读RECS为“对GOFAI的过度反应”,认为其真正反对的只是句子式、客观表征,而非一切计算。 但作者澄清:

  • RECS 的反表征主义是彻底的、原则性的
  • 分歧根本在于:能否在不诉诸表征的前提下,解释智能行为(包括高阶认知)。

两类主流反驳:

  1. 经验性质疑: “真实认知”(如思考过去/未来/远方)不可能无表征(e.g., Clark & Toribio 1994; Adams & Aizawa 2008)。
  2. 解释性质疑: RECS 所用模型(如动力系统)实际上隐含表征(e.g., Markman & Dietrich 2000; Wheeler 2005)。

→ 后者是本书第3–5章主攻方向;前者属经验问题,需实证回应。


🔸 四、两个关键实例:RECS 如何解释认知?

例1:Beer(2003)的仿真机器人
  • 任务:进化CTRNN控制机器人,实现对圆/菱形的范畴知觉与差异行动(捕圆避菱)。
  • 解释路径: 构建三分动力学模型: ① 脑–身–环境整体耦合系统(16变量) ② 智能体–环境互动动力学(dx/dt) ③ 神经实现机制(CTRNN活动流)
  • 关键结论: ✅ “知识”不内在于大脑,而在于脑–身–环境系统的历时性耦合; ✅ 辨别即行动、行动即辨别——知觉–认知–行动不可割裂; ✅ 全程未引入任何表征:解释的是做什么,而非如何表征世界

→ 体现RECS与杜威–詹姆斯自然主义的深刻连续性。

例2:van Rooij et al.(2002)的“想象拨棍”任务
  • 任务性质:典型表征饥渴型(representation-hungry)任务——被试需想象并预测尚未发生、不可感知的动作(用棍拨远物)。
  • RECS 解释: 借用Tuller等人的势场模型(V(x)=x4/4+kx2/2),以:
    • 集体变量 V(x):表征系统稳定性;
    • 控制参数 k=f(当前棍长,前次棍长,前次反应) → 成功预测并解释: ✓ 同化偏差(assimilative bias) ✓ 增强对比(enhanced contrasts) ✓ 滞后效应(hysteresis) ✓ 多稳态切换
  • 理论意义: ✅ 首次表明RECS可解释超越“最低限度认知” 的高阶任务; ✅ 挑战 Milner & Goodale 的双通路割裂论(背侧=非表征 / 腹侧=表征)与 Wheeler 的海德格尔式二分(上手=非表征 / 在手=表征); ✅ 实现预测性建模(非事后拟合),增强RECS科学严谨性。

🔸 五、本章结论与后续指向

  • RECS 是有深厚传统根基(非标新立异)、方法论自洽(动力系统)、实践有效(案例验证)的科学纲领。
  • 其根本挑战在于:能否在原则上拒绝表征而仍具充分解释力。
  • 第3–5章将系统回应“RECS模型隐含表征”的核心哲学质疑—— ⚠️ 预告:后续论证将“颇为艰深”(philosophy gets rather thick)。

2 身体认知与激进的身体认知

我刚刚提到,从哲学上反对科学方法是从未令人信服的。因此,与大多数哲学作品不同,我不会在这本书中论证为激进的身体认知科学腾出空间。但尽管我不会论证其他方法是错误的,我仍会说一些关于它们的内容,主要是为了说明激进的身体认知科学是如何融入其中的。一个相当令人惊讶的结果是,近年来越来越流行的具身认知科学(例如,克拉克1997年、2008年)既与激进的身体认知科学非常相似,又非常不同。尽管我即将阐述的心理学分类将包括许多非具身的方法,但我的重点将是具身。

2.1 心灵理论的分类:初步探讨

在他们1988年抨击联结主义的文章中,我们在第一章讨论过,福多和皮利辛说:

现代关于心灵的理论有两种主要传统,一种我们称之为“表征主义”,另一种我们称之为“消除主义”。表征主义者认为,假设表征(或“意向的”或“语义的”)状态是认知理论的必要组成部分;根据表征主义者,心灵中存在一些状态,其功能是编码世界的状态。相比之下,消除主义者认为,心理理论可以摒弃诸如表征这样的语义概念。根据消除主义者,心理理论的适当词汇是神经学的,或者也许是行为学的,或者也许是句法的;无论如何,不是用表征来描述心理状态的词汇。(1988年,7)

尽管他们在文章中没有进一步讨论消除主义理论——毕竟,文章的目的是在表征主义理论之间建立对比——福多和皮利辛所指的正是美国实用主义者(皮尔斯、詹姆斯、杜威;见赫夫特2001年;洛克威尔2005年)及其思想后裔(斯金纳、吉布森)的观点,以及吉尔伯特·赖尔、理查德·罗蒂(1979年)、斯蒂芬·斯蒂奇(大约1983年)和丹尼尔·丹尼特(大约1969年)的观点。这些消除主义者共同认为,心灵不是自然的镜子;他们是反表征主义者。因此,这就是对心灵和认知理论的第一次划分:有一些人认为认知的主要任务是我有时会称作“精神体操”的东西,即构建、操纵和使用对世界的表征,而另一些人则认为认知的任务是做其他事情。(见图2.1。)

值得指出的是,这种第一次划分几乎与美国科学心理学早期的功能主义者和结构主义者之间的区别相一致。关于这一区别的第一个要点是,20世纪早期的心理学功能主义者与20世纪后期心灵哲学的功能主义者没有任何共同之处。实际上,哲学功能主义者是心理学结构主义者的直接后裔。在20世纪早期的术语中,结构主义是源自威廉·冯特的德国心理学项目,最终源自康德和笛卡尔的心理学。一般来说,结构主义者认为,从事心理学的唯一方式是先确定我们心理生活中项目的结构,然后才适合尝试理解它们的功能。他们的观点是,就像在生物学中一样,必须先理解解剖学,然后才能理解生理学。另一方面,功能主义源自威廉·詹姆斯的美国心理学,最终源自达尔文。一般来说,功能主义者认为,只有在功能的背景下,才能理解心理行为。如果试图在心理生活和行为的整体之外,只看其部分,就会误解心灵。在接下来的内容中,为了避免术语冲突带来的混乱,我将把传统的心理学功能主义者称为“美国自然主义者”。(我遵循福多1990年的观点。)

结构主义者和美国自然主义者阵营之间的争论是一系列黑格尔式的争论,始于结构主义者铁钦纳的《简单反应》(1895年)。他在其中主张使用计时实验来确定心理过程的性质。铁钦纳描述的一个实验,由路德维希·兰格进行,涉及尝试确定注意力的持续时间。在兰格的实验中,受试者被要求完成两项任务,兰格认为这两项任务唯一的区别在于其中一项任务需要受试者关注感觉。实验结果使兰格能够确定感官注意力的持续时间。其背后的逻辑如下。根据像铁钦纳和兰格这样的结构主义者,心理行为具有以下结构:首先是刺激,由感受器的物理刺激引起;然后是一系列线性的心理行为;最后是行为反应。当然,当时和现在一样,哪些心理行为会发生,以及以何种顺序发生,是实验者的推测。假设存在两个简单的反应X和Y,它们唯一的区别在于X需要心理行为M1到M4,而Y只需要M1、M2和M4。那么,可以通过从完成X所需的时间中减去完成Y所需的时间,来确定M3的持续时间。为了从事心理学研究,铁钦纳认为,必须关注心理行为序列的结构,而不是它们的功能。

美国自然主义者约翰·杜威在他的经典论文《心理学中的研究弧概念》(1896年)中明确批评了兰格实验。杜威将结构主义者对简单反应的看法描述为“反射弧”。(它是一个弧,因为它从身体开始,上升到心灵,然后返回身体。)杜威认为,结构主义者对反射弧的理解犯了“经验主义谬误”,即假设部分先于整体。相反,根据杜威,从简单反应到最复杂的智能行为,所有行为都是有机回路,不能通过将其分解为部分来理解。脱离上下文,行为的一部分没有任何意义,用杜威的著名短语来说,就是“一系列抽搐”。此外,只有在事后才能将一个简单反射分解为部分。只有在确定了反应之后,才能识别出刺激。换句话说,在一个有机回路中,反应的性质决定了刺激的性质。也就是说,视觉刺激永远不会仅仅导致看到;相反,它会导致看到以便抓取并带到嘴边,或者看到以便抓取并挥动。因此,认为不同的简单反应由相同的部分组成,可以混合搭配,这是谬误。同样,杜威声称,任何试图仅用精神体操来解释认知的心理学,即任何心灵的表征理论,也是谬误。因此,福多经常批评杜威(例如,在福多1983年、1990年)也就不足为奇了。

这里的关键是,福多和皮利辛在表征主义和消除主义之间所作的区分,与心理学本身一样古老。我们应该注意到,当代认知科学坚定地站在表征主义者/结构主义者一边。

2.2 做出更细致的区分

在评论表征主义阵营是如何划分之前,我应该先简要谈谈心灵的表征理论。我假设大多数读者对心灵的表征理论(RTM)并不陌生,因此我将简要描述一下。杰里·福多(1981年)将RTM阐述为对以下五个假设的承诺:

a) 命题态度状态(例如信念和愿望)是关系性的。

b) 这些关系中涉及的是心理表征。

c) 心理表征是符号:它们既有形式属性,也有语义属性。

d) 心理表征因其形式属性而具有因果作用。

e) 命题态度从作为其对象的心理表征那里继承了它们的语义属性。(1981年,第26页)

因此,思想(命题态度)是人与代表世界中事物的心理表征之间的关系(它们的语义属性)。任何认为认知涉及可语义评估的内部实体的理论,都是心灵表征理论的一种形式。

从历史上看,RTM是一种非常广泛被接受的心灵理论,至少可以追溯到圣奥古斯丁。

所有RTM都有上述共同点。它们之间的差异在于这些符号在认知中如何被使用。RTM的一个特别重要的变种是心灵的计算理论(CTM),它也有着悠久的历史,可以追溯到霍布斯。在《利维坦》中,霍布斯说:“我所说的推理,就是计算。”更具体地说,他声称理性思维(推理)是处理内部符号的过程(计算),这些符号代表外部对象;这些符号根据规则进行处理,当正确应用这些规则时,就会产生理性思维。

当一个人推理时,他所做的不过是通过将部分相加来构想一个总数,或者通过从一个总数中减去另一个总数来构想一个剩余数……这些操作不仅适用于数字,还适用于所有可以相加和相减的事物。正如数学家教授如何在数字中进行加法和减法……逻辑学家则教授如何在词语的推论中进行同样的操作;将两个名称组合在一起形成一个肯定句,将两个肯定句组合在一起形成一个三段论;将许多三段论组合在一起形成一个证明。(1651年,第一部分,第五章;引自豪格兰德1985年)

实际的思维是对心理表征的操纵(通过其因果的、形式的属性进行)。这正是今天的心灵计算理论。唯一的区别在于心理计算是如何工作的。对霍布斯来说,这真的是加法(“将两个名称组合在一起形成一个肯定句,将两个肯定句组合在一起形成一个三段论”)。当然,当代的计算主义者受益于20世纪对计算的理解。因此,对他们来说,计算是福多所说的“思想语言”中形式符号的规则性操纵。这些形式符号与理想化的自然语言词汇有许多共同属性。它们是离散的、与上下文无关的标记;它们可以组合成更大的分子表征(类似于句子),其意义取决于构成它们的部分。这种经典的心灵计算理论,即认知是具有所有这些属性的形式符号的规则性操纵,通常被称为“老式人工智能”或GOFAI(豪格兰德1985年)。还有许多其他版本的RTM,其中符号并不具备思想语言中符号的所有属性,或者在认知中以不同的方式使用,或者两者兼有。由于当前的兴趣,以及对许多优秀工作的不公平贬低,我将简单地将这些不同风格的符号和符号操纵称为“其他RTM”和“其他CTM”。见图2.2。

我们也可以在消除主义阵营中做出一些更细微的区分。如上所述,心理学中最突出的消除主义版本是美国自然主义,其中认为认知不能被理解为世界的镜子,也不能脱离动物的活动,甚至其整个生命来理解。美国自然主义的两个非常不同的后代分别是行为主义(它本身也有许多变种)和吉布森的生态心理学(吉布森1966年、1979年)。另一种消除主义形式,被福多和皮利辛在本章开头引用中提到的,实际上是心灵计算理论的近亲。丹尼特和斯蒂奇在其职业生涯的某些阶段都曾主张认知是逻辑演算中句子的规则性操纵,但由于语义解释的系统性困难,这些句子不是表征。也就是说,丹尼特(1969年)和斯蒂奇(1983年)都认为认知是一种非表征性的精神体操。斯蒂奇(1996年)肯定已经放弃了这一立场;丹尼特可能也是如此。(参见他对米利肯1984年的导言。)因此,我们可以将图2.3中所示的消除主义部分进行划分,这幅图展示了丹尼特和斯蒂奇早期工作的模糊位置。我承认,这幅图有些复杂。但正是在这种背景下,我们试图理解从20世纪90年代初开始在认知科学中兴起的身体认知运动。

2.3 具身认知科学

如今,许多认知科学声称是具身的、情境化的,或两者兼有。通常,那些讨论情境化、具身认知的人从罗德尼·布鲁克斯(1991年)的早期工作开始讲起。(参见史密斯1991年、1996年;克拉克1997年、1999年、2003年、2008年;阿格雷1997年;克兰西1997年;莱科夫和约翰逊1999年;费弗和谢尔1999年;多里什2001年;布雷泽尔2002年;安德森2003年;威尔逊2004年;加拉格尔2005年;惠勒2005年;吉布斯2005年;罗兰兹2006年;梅纳里2007年。)为了公平起见,我会追溯得更早,回到美国自然主义的后代詹姆斯·吉布森(1979年)的工作,以及约翰·巴威斯和约翰·佩里的合作(1981年、1983年)。

吉布森(1979年)的生态视觉理论是作为对计算主义心灵理论日益主导地位的直接回应而提出的,根据计算主义理论,感知和思维是对内部表征的规则性操纵。吉布森的生态感知方法有三个主要观点。首先,感知是直接的,也就是说,它不涉及计算或心理表征。也就是说,吉布森认为感知不是在感觉上内部添加信息的问题。其次,感知主要是为了指导行动,而不是为了获取与行动无关的信息。我们感知环境是为了去做事情。第三个观点是由前两个观点推导出来的。因为感知不涉及对刺激的心理添加信息,但能够适应性地指导行为,所以所有用于指导适应性行为的信息必须在环境中可供感知。因此,吉布森生态方法的第三个观点是,感知是关于可供性(affordances)的,即直接可感知的、环境中的行为机会。正如吉布森所深知的,可供性在本体论上是独特的:

[A]可供性既不是客观属性,也不是主观属性;或者如果你愿意,它既是。可供性跨越了主观—客观的二分法,帮助我们理解其不足。它既是环境的事实,也是行为的事实。它既是物理的,也是心理的,但又都不是。可供性指向两个方向,指向环境和观察者。(1979年,第129页)

尽管存在这种本体论上的独特性以及围绕如何最好地理解可供性的争议(图尔维1992年;里德1996年;斯托弗雷根2003年;切梅罗2003a;斯卡兰提诺2003年;萨辛、卡克马克、多加尔、乌古尔和乌科卢克2007年;切梅罗和图尔维2007a;参见下文第七章),但可供性的概念——脱离了与直接感知的关系——是吉布森理论中从一开始就受到广泛关注的唯一方面,例如,从设计师那里(参见诺曼1988年)。吉布森的其他观点在其出现时并没有被认知科学家广泛接受。然而,它们被广泛讨论(参见福多和皮利辛1981年;图尔维等人1981年),并且确实吸引了一批忠实的支持者。最近,吉布森成为具身认知科学的英雄之一,具身认知科学采纳了这些观点(经过大幅软化)作为自己的观点。(下文将对此进行更多讨论。参见特别是第五章、第六章和第七章。)

稍微接近现代一些,我们可以将具身认知科学的情境化方面的起源追溯到情境语义学,这是约翰·巴威斯和约翰·佩里在1980年代从事的心灵哲学和语言哲学工作(巴威斯和佩里1981年、1983年)。他们认为自己为吉布森心理学提供语义学,巴威斯和佩里认为,如果不考虑思想者在空间上的定位(即情境化),因此只有局部可用的不完整信息,我们就无法理解意义或认知。每个思想者和说话者都是某个人,他处于某个位置,并且只意识到某些事物。这一观点的一个主要结果是,指示词从认知账户的边缘转移到中心。其观点是,因为我们处于环境中,关于“这里”“那里”“现在”和“我”的思想是无处不在的。我们将看到,这种对指示词的关注是具身认知科学的一个关键但几乎是偶然的特征。巴威斯和佩里的第二个重要特征直接来源于其吉布森式的动机。巴威斯和佩里发展情境语义学是为了在不涉及心理表征的情况下解释意义。在他们的非表征性解释中,拥有有意义的思想(感知、话语)与拥有心理表征,或者任何可以被称为认识论的东西无关。思想和句子的意义是思想者/说话者与他们环境中信息之间的关系问题。

巴威斯和佩里的情境语义学的后一方面正是罗德尼·布鲁克斯(1991年、1999年)在用“情境化”一词描述他的机器人时所关注的。当布鲁克斯说他的简单、移动机器人是情境化的时,他的意思是,因为它们处于一个不断变化的世界中,它们不需要使用世界表征来规划或指导它们的行为。相反,它们直接与世界本身互动。其观点是,当你可以直接行动并再次检查时,就没有必要在机载设备上存储信息,并对行动过程中事物如何变化做出预测。布鲁克斯用“世界是其自身最佳模型”这一口号总结了他的反表征主义。这种类似吉布森的对心理表征的怀疑或许是布鲁克斯早期工作中最(臭名昭著的)方面,但使布鲁克斯成为具身认知科学榜样的并不是他的反表征主义。相反,是他坚持认为智能必然是具身的。布鲁克斯认为,与真实世界的真实互动,而不是精神体操,才是智能的标志。实际上,布鲁克斯把巴威斯和佩里的观点提升了一个层次:对布鲁克斯来说,不仅思想者的环境,而且其物理构成,也是理解其智能、思维等本质的关键。当然,拥有对智能行为至关重要的物理构成,保证了处于物理(更不用说社会)环境中的情境化。具身认知必然是情境化的。

从这些来源(当然还有其他来源)产生的当前具身认知科学工作是一个广泛的基础运动,涵盖了机器人技术、模拟进化、发展心理学、感知、运动控制、认知工具、现象学以及当然的理论宣言等领域的研究。鉴于这些多样化的主题,理论方法也各不相同。然而,以下观点在具身认知科学家中或多或少是普遍接受的。

互动性解释与动态系统理论

解释包含身体和环境方面的认知系统需要一种能够跨越主体—环境边界的解释工具。许多具身认知科学家使用动态系统理论。也就是说,许多(尽管不是全部)具身认知科学的支持者认为认知系统是动态系统,最好使用动态系统理论的工具来解释。动态系统是一组定量变量,这些变量根据动态定律持续、同时且相互依赖地随时间变化,这些定律原则上可以用一组方程来描述。说认知最好用动态系统理论来描述,就是说认知科学家应该尝试将认知理解为智能行为,并使用特定类型的数学(通常是微分方程组)来模拟智能行为。

动态系统理论特别适合于解释认知作为与环境的互动,因为单个动态系统可以在皮肤的两侧都有参数。也就是说,我们可能会使用类似以下方程(来自比尔1995a)来解释主体在环境中的行为随时间的变化:

其中,AE 是连续时间动态系统,分别模拟有机体及其环境,

是从环境变量到有机体参数以及从有机体变量到环境参数的耦合函数。我们之所以将有机体和环境视为分离的,只是出于方便(以及习惯);实际上,它们最好被视为形成一个不可分解的单一系统 U。这种模型不是描述外部(和内部)因素如何导致有机体行为的变化,而是解释整个系统 U 如何随时间展开。

还值得指出的是,动态系统理论对于是否将参数或变量值视为表征是中立的。

改变表征的角色

尽管具身认知科学的主要建模工具——动态系统理论——对于心理表征是中立的,但除了少数例外(见第2.4节),具身认知科学家拒绝布鲁克斯、吉布森和巴威斯与佩里关于心理表征的最强主张。也就是说,具身认知科学家通常并不是反表征主义者。然而,尽管具身认知科学家确实使用表征来解释行为,但他们以一种减少对精神体操需求的方式使用表征。他们所使用的表征是索引功能型的(Agre和Chapman,1987年)、推拉型的(Millikan,1995年)、行动导向的(Clark,1997年)或模拟器表征(Grush,1997年,2004年;Churchland,2002年)。在下文中,我将使用克拉克的术语“行动导向表征”来统称这些表征。行动导向表征与早期计算主义心灵理论中的表征不同,它们以非中性的方式表征事物,即以适合动物行动的方式,作为可供性而存在。行动导向表征比其他表征更原始,因为它们可以在不需要分别表征世界状态和认知系统目标的情况下引导有效行为。也就是说,代理的感知系统无需构建一个行动中性的世界表征,然后由代理的行动生成部分使用该表征来指导行为;相反,代理从一开始就产生与其行动相关的表征。通过关注行动导向表征,具身认知科学家试图最小化安迪·克拉克(2001年)所称的“客观主义”表征的作用:这些表征是以思想语言对行动中性环境的句子式表征。

智能的身体、脚手架化的环境、模糊的边界

鉴于对精神体操重要性的最小化,解释复杂、智能行为成为一个挑战。在具身认知科学中,一部分智能从大脑“卸载”到身体和环境中。在这种观点下,我们的身体是设计精良的工具,使其易于被大脑控制。例如,我们的膝盖限制了腿部可能的运动范围,从而大大简化了平衡和行走。夸张地说,人类学习行走之所以容易,是因为我们的腿已经“知道”如何行走。(参见Thelen和Smith,1994年;Thelen,1995年。)这种“卸载”超出了我们皮肤的边界。自然环境本身已经充满了可供性和信息,可以指导行为。正如河狸筑坝一样,动物通过与环境的互动和改变,增强了这些可供性。Kirsh和Maglio(1994年;另见Kirsh,1995年)表明,操纵环境通常是解决问题的辅助手段。他们的例子是《俄罗斯方块》玩家在屏幕上旋转方块,从而避免了复杂的心理旋转。Hutchins(1995年)表明,社会结构和设计精良的工具使人类能够轻松完成否则过于复杂的任务。这使得许多人认为,认知系统不仅限于大脑或身体,还包括环境的某些方面(Clark,1997年;Rowlands,2006年;Menary,2007年;Hutto,2007年)。克拉克(2003年)甚至认为,外部工具(包括电话、计算机、语言等)对人类生活如此重要,以至于我们实际上是赛博格,部分由技术构成。

这三条原则表明,尽管受到美国自然主义者詹姆斯·吉布森的影响,具身认知科学仍然是表征理论的一种形式。事实上,尽管与老式人工智能(GOFAI)有许多不同,具身认知科学仍然是一种心灵的计算理论。这可以从Kirsh和Maglio对《俄罗斯方块》玩家旋转方块的描述中看出:他们说,方块旋转是将计算复杂性“卸载”到环境中的问题,因此旋转是计算的一部分。克拉克(2001年)也同意这种观点,他呼吁一种动态计算主义,使我们能够看到动态模型中的某些实体是跨越大脑、身体和环境的计算系统中的表征。因此,我们可以将具身认知科学加入我们的分类体系,如图2.4所示。具身认知科学,像丹尼特(1969年)和斯蒂奇(1983年)一样,处于一种相对模糊的位置。具身认知科学深受美国自然主义世界观的影响,尤其是吉布森的生态心理学,但它也是一种心灵的计算理论。

本章的最后问题是激进具身认知科学如何融入其中。特别是,它与具身认知科学有何关联?

2.4 激进具身认知科学

本书题为《激进具身认知科学》。现在是时候阐明这一概念的内涵了。“激进具身认知”(radical embodied cognition)一词出自安迪·克拉克(Andy Clark),他对其定义如下:

激进具身认知论题:关于认知的结构性、符号性、表征性与计算性观点是错误的。具身认知最好通过非计算性、非表征性的观念与解释方案来加以研究,例如借助动力系统理论(Dynamical Systems theory)等工具。(Clark 1997, 148;2001, 129)

克拉克在如下文献中发现了支持这一立场(或一系列立场;参见下文)的论证:Maturana 与 Varela(1980);Skarda 与 Freeman(1987);Brooks(1991);Beer 与 Gallagher(1992);Varela、Thompson 与 Rosch(1991);Thelen 与 Smith(1994);Beer(1995a, b);van Gelder(1995);van Gelder 与 Port(1995);Kelso(1995);Wheeler(1996);以及 Keijzer(1998)。我们或许还可补充:Kugler、Kelso 与 Turvey(1980);Turvey 等(1981);Kugler 与 Turvey(1987);Harvey、Husbands 与 Cliff(1994);Husbands、Harvey 与 Cliff(1995);Reed(1996);Chemero(2000a, 2008);Lloyd(2000);Keijzer(2001);Thompson 与 Varela(2001);Beer(2003);Noë 与 Thompson(2004);Gallagher(2005);Rockwell(2005);Hutto(2005, 2007);Thompson(2007);Chemero 与 Silberstein(2008a, b);Gallagher 与 Zahavi(2008);以及诸多其他学者。要点在于:这是一套被真实持有的立场;克拉克正是希望否认其说服力。

激进具身认知包含两项肯定性主张与一项否定性主张:

激进具身认知,主张1:关于具身认知的表征性与计算性观点是错误的。激进具身认知,主张2:具身认知应通过某一特定工具集 T加以解释,该工具集包含动力系统理论等。激进具身认知,主张3:工具集 T中的解释工具不预设心理表征(mental representations)。

尽管我认为主张1是正确的,但本书无意为之辩护——第一章的核心观点即在于:无人真正信服此类论证。因此,剩下来需要关注的是主张2与主张3。这两项主张共同构成了激进具身认知科学(radical embodied cognitive science)——即关于激进具身认知的科学。我在此将激进具身认知科学定义为:对知觉、认知与行动作为必然具身化现象(necessarily embodied phenomenon)所开展的科学研究,其采用的解释工具不预设心理表征。这是一门无需“心智体操”(mental gymnastics)的认知科学。本书的目标正是确切阐明:从事激进具身认知科学究竟意味着什么。不过目前,我想先说明它如何嵌入本章迄今所述的心智理论分类体系之中。

理解具身认知科学与激进具身认知科学之间关系的最佳途径,是再次回溯具身认知科学的历史渊源。如前所述,具身认知科学兴起于对吉布森(Gibson)、巴威斯与佩里(Barwise and Perry)以及布鲁克斯(Brooks)等人某些思想的接纳,但同时又对其最激进的主张有所退缩。具体而言,具身认知科学接纳了具身性的必然性动力学解释的价值,却将其与心智的计算理论(computational theory of mind)相结合。真正值得关注的,是具身认知科学所拒斥的那些主张:情境化的、具身的认知科学家通常拒斥吉布森、巴威斯与佩里、布鲁克斯所持的反表征主义(antirepresentationalism);而反表征主义(它蕴含着反计算主义)恰恰构成了激进具身认知科学的核心。

激进具身认知科学是一种消除论(eliminativism),其历史根源可追溯至美国自然主义(American naturalism)。(请记住:吉布森的生态心理学乃是詹姆斯(James)与杜威(Dewey)工作的直接后裔。⁷)因此,我建议:激进具身认知科学并非具身认知科学的“激进化”(radicalization);相反,具身认知科学应被视作对激进具身认知科学的稀释(watering down),并试图将一种本质上源于美国自然主义、具有消除论倾向的理论,与心智的计算理论强行嫁接。图2.5正体现了这一点。

这种分类之所以重要,有两个原因。第一,必须明确:激进具身认知科学属于一个值得敬重的科学传统——该传统始于美国心理学的诞生,因此绝非为激进而激进的标新立异。第二,一旦将具身认知科学理解为部分源自激进具身认知科学的后裔,便能有效削弱一种常见批评。克拉克曾多次主张(1997, 2001, 2008;Clark & Toribio 1994;Clark & Grush 1999):激进具身认知科学所持的反表征主义是误置的。他实际上认为,激进具身认知科学家错误地将其对“良构旧式人工智能”(GOFAI)的反对,扩展成了对一切计算主义的反对。他暗示,激进具身认知科学家真正反对的,其实是客观的、句子式的表征(objective, sentence-like representations)。据此,克拉克认为,激进具身认知科学家所推动的,是对认知主义革命中“良构旧式人工智能”的一种过于彻底的决裂;他们本应满足于不那么激进的决裂——亦即具身认知科学所代表的那种立场。

然而,一旦人们意识到:激进具身认知科学并非近期从计算主义中分裂出的异端,亦非“具身认知科学+反表征主义”的简单叠加,而是彻头彻尾的消除论(eliminativist root and branch),上述论证的说服力便大为削弱。相反,我认为,举证责任应落在具身认知科学一方——它必须证明:自己将美国自然主义思想纳入计算主义框架的尝试,似乎是稳固可行的(truly stable)。

当然,仅仅指出“激进具身认知科学并非仅仅是反表征主义的具身认知科学”这一点,尚不足以使其在与表征主义批评者的论争中彻底胜出。它不过是论辩“网球”中一次责任回击:现在轮到具身认知科学家去论证——他们所构建的“美国自然主义+计算主义”杂合体,确实站得住脚。即便举证责任如此转移,事实依然成立:具身认知科学与激进具身认知科学之间的分歧,核心仍在于表征在解释中所扮演的角色

具身认知科学的支持者及其他计算主义者,仍可从以下两种方式之一,对激进具身认知科学展开反驳:第一,他们可声称:若不借助“心智体操”(mental gymnastics),将不可能解释真正意义上的认知现象。(参见,例如:Clark & Toribio 1994;Adams & Aizawa 2008。)第二,他们可主张:激进具身认知科学所使用的模型与理论,实际上仍赋予认知系统以表征。(Clark 1997;Markman & Dietrich 2000a,b;Wheeler 2005。)

本书第3、4、5章将对此第二种反驳路径作出长篇回应。至于第一种反驳——即“真正的认知无法脱离表征加以解释”——显然属于一个经验性问题,无法在此一锤定音。不过在下一节中,我将简要概述两项激进具身认知科学研究的实例。此举旨在初步展示:激进具身认知科学如何进行解释迄今已解释了哪些现象,并让人初步感受到:它究竟如何能够解释真正智能的行为。⁸

2.5 实例一:跨越脑–身–环境边界

兰迪·比尔(Randy Beer)2003年⁹发表于《自适应行为》(Adaptive Behavior)的靶文(target article),清晰展现了激进具身认知科学的核心要义:它运用动力系统理论(dynamical systems theory)来描述并解释一个由进化而来的人工神经网络所控制的仿真机器人的行为。这项工作不仅体现了动力学建模的解释风格,亦明确表明:激进具身认知科学与神经网络研究人工生命方法论(artificial life methodologies)完全兼容——尽管后两者常被笼统归入计算主义阵营。

在该研究中,比尔采用人工进化(artificial evolution)方法,生成了一个能实现范畴知觉(categorical perception)的人工智能体——即为适应性行为目的,对环境中实体进行分类。被研究的智能体是一个圆形仿真机器人,其身体六分之一周长上水平排列着七只“眼睛”(‘‘eyes’’)。这些“眼睛”连接至一个连续时间、实值神经网络(CTRNN, continuous time, real-valued neural network),共含14个神经元:7个感觉神经元(各接收一只“眼睛”的输入);5个中间神经元(接收感觉神经元及其他中间神经元的连接);以及2个运动神经元(接收中间神经元的输入,并控制机器人的两个马达)。(见图2.6。)

该CTRNN经进化训练,使其智能体能对环境中圆形菱形物体进行分类,并作出差异性响应:在每次试验中,一个圆形或菱形物体从机器人活动场地上方落下;经进化后的CTRNN使智能体捕捉圆球、避开菱形

比尔的动力学分析聚焦于完成任务最成功的那个智能体——其成功标准定义为:有效避开菱形并捕获圆球。经过80代进化,该最优智能体在24次评估试验中成功率逾99%,在10,000次随机生成的试验中成功率逾97%。它达成此绩效的方式是:首先旋转身体以“中央凹注视”(‘‘foveate’’)目标物体;继而一边朝物体移动,一边通过来回旋转进行扫描;最终——若为圆球则趋近捕获,若为菱形则急剧转向避开。

在进入比尔的动力学分析之前,需先明确此行为的三点特征:

第一,每次试验中的行为既是辨别(discrimination)亦是行动(action),但二者不可分割——行动本身构成了辨别的一部分,而辨别又决定了最终行动的形式。趋近或避开过程中所进行的旋转扫描,对辨别而言至关重要。

第二,正因行动内嵌于辨别之中,该辨别并非瞬时事件,而是贯穿整个试验过程的历时性展开。这一点将在后文凸显为激进具身认知科学的关键特征:知觉、认知与行动均需时间

第三,须注意:该模型针对的是单一个体智能体,而非群体。这种对个体的关注,是动力学分析的常见特征——它将行为(尤其是发展)视作特定大脑在特定身体中、于特定环境里逐步展开的过程,而非神经或遗传程序的机械执行。秉持此种对“特殊性”(particulars)的立场,个体差异被视作数据,而非噪声。(尤其参见:Thelen & Smith 1994;Thelen 1995;Kelso & Engstrøm 2006。)

接下来,进入比尔的分析。

比尔构建了一个三部分的动力学模型来刻画该智能体的行为: ① 一部分建模脑–身–环境系统; ② 一部分建模智能体–环境系统; ③ 一部分建模智能体行为在环境中的神经实现机制(neural implementation)。

我将依序考察这三部分;此处将暂且省略大部分数学细节——它们基本属标准神经网络数学范畴。(不必担心:后文自有大量公式。)


整体耦合系统:进化所得神经系统 ⊕ 身体 ⊕ 环境

比尔的第一重分析最为全面,因而系统规模最大。该CTRNN+智能体+环境系统的模型是一个十六变量动力系统:14个变量对应各神经元的状态;1个变量 x 表示智能体与目标物体的水平距离;1个变量 y 表示物体的垂直距离(回忆:物体从上方坠入场中)。

由于系统含十六个变量,其相图将具十六维——对我们这些视觉系统特化于“三维空间+一维时间”的生物而言,这显然无法直观呈现。变量 y(垂直距离)本身并不特别有趣:因物体以恒定速率下落,且各次试验速率不变,y 遵循一固定轨迹。绝大多数动态变化发生于其余变量之中。

  • 7个感觉神经元的状态是物体距离(x, y)与物体身份(形状)的函数;
  • 5个中间神经元的状态由感觉神经元状态决定,且因存在侧向连接,亦受其他中间神经元状态影响;
  • 2个运动神经元的状态则由中间神经元状态决定。

请注意:运动神经元的输出驱动马达,改变智能体位置,从而影响水平距离 xx 的变化又影响“眼睛”接收的输入,进而改变感觉神经元状态,再影响中间神经元,继而反馈至运动神经元……如此循环往复。

该系统仅有1个参数:物体的身份(identity),它决定了状态空间的形状。换言之,物体的形状(圆形或菱形)决定了这十六个相互耦合变量的动力学行为。由于单次试验中物体形状恒定(非圆即菱),该动力系统拥有两个不同的状态空间:一个对应圆形物体,一个对应菱形物体。

借助这一十六变量、单参数的动力学模型,我们得以洞悉智能体所有可能的环境移动方式,及其与环境、大脑的关联。也就是说,该模型不仅能精确预测智能体大脑与机器人在环境中的具体行为,还可展示其在一切可能情境下的行为模式,并细致刻画CTRNN、智能体运动与物体在分类与行为生成中的作用


智能体–环境系统

前述模型展示了系统整体如何随时间演化。第二重模型则聚焦智能体–环境系统,旨在解释:智能体与物体的相对位置如何影响智能体运动,而运动又如何反过来改变二者相对位置。与此最相关之动力学,由水平距离对时间的一阶导数 dx/dt(即智能体与物体间水平距离的变化率)决定。该变化率取决于马达活动,进而取决于运动神经元活动。

利用此变量,可为智能体视野内每一点绘制:若物体位于该处,智能体将如何以特定速度与方向穿越视野。由此即可精确获知智能体运动与物体位置之间的相互作用方式。


智能体动力学的神经实现

比尔模型的第三部分是对CTRNN本身的建模,其目的在于解释:给定神经网络的数学结构,物体处于某一位置时,如何影响网络状态,进而驱使马达以特定方式运动?该模型生成一张神经网络(尤以运动神经元为重)活动图谱,覆盖智能体可能遭遇的所有视觉情境。借此可观察单个神经元如何随时间变化,研究网络的时间动力学,并揭示这些动力学如何导致智能体–环境系统模型中所描绘的运动行为。

然而须注意:单凭CTRNN模型本身,是对系统的一种贫化刻画(impoverished as a model)。若仅使用CTRNN模型,我们只能推断:某一瞬时输入将如何影响一个此前处于静息状态的网络。但由于该网络是递归式(recurrent)的,任何瞬时输入的效果,极大程度上取决于输入到达时网络的背景活动(background activity);而该背景活动本身,又由一连串先前输入所塑造。换言之,CTRNN模型仅在已知典型输入流序列(即典型背景活动的成因)。视觉刺激的效果,由先前刺激及其引发的行为反应共同决定。因此,CTRNN模型的效用,仅当与整体耦合系统模型及智能体–环境动力学模型结合时才得以实现。

这三重动力系统共同构成一个单一的三分模型(single tripartite model)。


凭借这一三分动力学模型,我们获得了对该智能体在环境中行为的非凡完整的刻画

  • 从第①部分可知:系统整体将如何随时间演化;
  • 从第②部分可知:智能体与物体关系如何随时间变化;
  • 从第①与第③部分可知:该简易神经系统如何对物体作出反应。

在每种情况下,我们所掌握的知识均覆盖一切可能情境。因此,我们不仅对智能体、CTRNN与环境的实际行为有极其完备的描述,更具备足够信息以预测其未来行为与反事实情境下的行为

这些模型还揭示:智能体的“知识”并不驻存于其进化所得的神经系统之中。将物体分类为圆或菱的能力,依赖于智能体历时性延展的运动;而该运动本身,又由物体的性质与位置以及神经系统共同驱动。要恰切把握此“知识”,必须同时描述智能体的脑、身与环境

请注意:所有这些动力学模型在解释智能体行为时,均未诉诸CTRNN中的心理表征(representations)。其解释对象是智能体之所为(以及可能为之),而非其如何表征世界。此种解释范式——关注智能体在环境中的行动,而非将其视作“表征者”——是动力学建模的常见特征;它亦典型地体现了比尔所践行的激进具身认知科学,与杜威、詹姆斯所代表的美国自然主义之间的深刻关联。

2.6 实例二:满足“表征饥渴”

刚才讨论的兰迪·比尔的动力学模型,最初发表于《自适应行为》(Adaptive Behavior)的一篇靶文(target article)。尽管该文收到了若干颇具启发性的回应,我特地挑出其中一篇予以关注——并非因其格外有趣或原创,而恰恰因其代表了一种对激进具身认知科学极为常见的回应。希蒙·埃德尔曼(Shimon Edelman)的评论文章《但它能扩展吗?没有表征则不能》(“But Will It Scale Up? Not without Representations”, 2003)同时批评了比尔所构建的智能体及其动力学模型:

“比尔的反表征立场,似乎在他自己所举的‘进化出的形状分类系统’一例面前就已站不住脚……首先,他所调用的分析方法,即便在其刻意选择的‘玩具式’设定中,也几乎难以胜任该任务。在此他并不孤单:当前根本不存在适于以分层、功能性术语分析复杂动力学的数学工具。其次,或许更为重要的是,其分析目标——即该玩具任务的进化解——似乎根本不值得如此费力。”(2003, 274)

此类对激进具身认知科学的抱怨极为普遍。激进具身认知科学的大量工作,聚焦于常被称为最低限度认知行为(minimally cognitive behavior)的现象,如范畴知觉、协调、运动等。尽管这类行为与“创作十四行诗”相距甚远,但考虑到激进具身认知科学坚持知觉与行动对认知的必然性,此类研究实属恰当。正如埃德尔曼正确指出的,鉴于当前可用的分析与计算工具之局限,对最低限度认知行为的关注亦属必要。(不过,若我不指出——这些工具正日臻完善——则有失公允。)

反对者进而主张:认知科学真正需要的,是一种能解释真实认知(real cognition)的进路;而要做到这一点,必须依赖表征

据我所知,此类针对激进具身认知科学的回应,最早版本出自克拉克与托里比奥(Clark & Toribio, 1994)。他们在对机器人学与动力系统理论中的非表征研究予以同情性讨论后,转而指出:此类工作所解释的最低限度认知行为,不可能构成全部故事。他们质疑:此类研究(即激进具身认知科学)是否终能解释他们所谓**“表征饥渴型认知任务”(representation-hungry cognitive tasks)。克拉克与托里比奥声称,某些任务根本无法在无表征的情况下完成**。例如:若无对时空遥远对象与事件的心理表征,人如何能思考它们?他们建议的应对之道是:承认非表征分析或许适用于布鲁克斯(Brooks, 1991)所称的“智能系统的最庞大组成部分”,但更高级的认知——如思考过去、未来、远方环境——则必须依赖内部表征与计算

一些人认为,克拉克–托里比奥式的“表征/非表征折中立场”,似乎可在脑科学证据中找到支持。米尔纳与古德尔(Milner & Goodale, 1995)著名地提出:大脑视觉活动存在两条通路(two streams): 其一为背侧视觉通路(dorsal visual stream),连接至运动脑区,功能在于实时行动引导中的视觉(vision for the guidance of real-time action);背侧通路的活动处于意识觉知之外。 其二为腹侧视觉通路(ventral visual stream),连接至物体识别脑区,功能在于(有时为意识性的)物体识别(identification of objects)。

乔尔·诺曼(Joel Norman, 2002)据此主张:视觉通路的这种划分,必然要求认知科学采取方法论上的二分:非表征进路适用于解释背侧通路所支撑的“行动中的视觉”,而表征性与计算性进路则更适合解释腹侧通路。当然,人们可接受此观点,并将激进具身认知科学限定于“行动中的视觉”领域,而将计算进路用于“真正”的、表征饥渴型认知。惠勒(Wheeler, 2005)则未诉诸神经科学,而是借重海德格尔(Heidegger)来提出类似主张。

海德格尔著名地区分了人与世界打交道的两种模式:上手状态(ready-to-hand)与在手状态(present-at-hand)¹⁰。惠勒赞同诺曼的观点,认为非表征模型或许足以捕捉我们以上手方式对世界的主动应对(active coping);但当我们以在手方式遭遇世界、对其进行反思性思考时,则必须诉诸结构性表征加以解释。

然而,还存在另一种不那么悲观(less defeatist)的可能性:即通过经验研究,证明激进具身认知科学本身即具备解释表征饥渴型任务的资源。范鲁伊(van Rooij)、邦格斯(Bongers)与哈瑟拉格(Haselager)(2002)便采取了这一进路。(另见第5.1节案例8,为另一项对表征饥渴任务的动力学解释¹¹)他们向被试提供一系列长度各异的棍子——按“递增后递减”或“递减后递增”的序列呈现——并要求被试想象自己能否用这些棍子去拨动一个远处物体。由于被试被要求预测一项尚未成行、因而不可感知的想象性行动之结果,该任务显然属于表征饥渴型:看似必须将所判断的距离所判断的“手臂+棍子”总长度加以比较。事实上,有人甚至会主张:对待拨动物体之距离的判断,本身即需借助心理比较——即将物体的预期实际大小与其视网膜成像大小进行比对。

在开展实验前,范鲁伊等人假设:该任务与塔勒(Tuller)等人(1994)所研究的言语范畴化任务(speech categorization task)相似。该言语任务的具体细节对当下目的而言并不重要;关键在于——假设两类任务相似,即意味着塔勒等人为其数据所建立的动力学模型,亦应能解释被试的“想象性棍子拨动”行为。塔勒等人的模型是一个势场(potential field),由如下方程描述:

其中,V(x) 是系统势能(system potential),用于衡量在位置 x 处的相对稳定性。相对于邻近位置而言,高势能表明:位置 x 在势场中是不稳定的,系统将倾向于不驻留于位置 x。

V(x) 是该模型的集体变量(collective variable),即决定系统整体涌现行为(overall emergent behavior)的变量。在方程中,k 是控制参数(control parameter),它决定状态空间的整体形状;k 是特定试验中棍子长度、先前试验中棍子长度以及被试在先前试验中反应的一个函数,并被约束于 -1 至 1 的范围之内。由该方程所确定的状态空间如图2.7所示。请注意,当集体变量 k = 0 时,此势场具有两个极小值——一个对应于被试判断“是,她可以用这根棍子拨动远处物体”,另一个对应于“否,她不能”。此时,系统被称为多稳态(multistable),被试可能回答“是”或“否”。但当 k = -1 或 1 时,仅存在一个极小值,对应于对问题唯一可能的答案。

塔勒等人模型可应用于想象性拨动任务的假设,引出了该实验的四个预测结果。第一,将出现同化偏差(assimilative bias)。由于 k 随前一试验及当前棍子长度而变化,被试在连续试验中倾向于给出相同反应。也就是说,当前试验将倾向于被同化至前一试验。第二,前一试验中的棍子长度与“是”答案的概率之间将呈现反向关系。也就是说,若在第5次试验中被试持有一根特别长的棍子,则她在第6次试验中更有可能回答“否”。第三,多稳态将以两种方式显现。在某些情况下,将出现增强对比(enhanced contrasts):当棍子长度在相当数量的试验中增加且被试回答“是”,随后棍子长度在若干次试验中减小时,被试将更有可能对一根此前曾获“是”答案的较短棍子回答“否”。(反之亦然,以更短的“否”作类推。)在其他情况下,将出现滞后效应(hysteresis):当棍子长度在相对较少次数的试验中增加且被试回答“是”,随后棍子长度在若干次试验中减小时,被试将更有可能对一根此前曾获“否”答案的棍子回答“是”。参见表2.1。第四,如图2.7所示,多稳态区域的大小随不同 k 值而异。当多稳态区域较大时,会出现许多同一根棍子获得不同答案的情况;当多稳态区域较小时,此类切换将更少。

当范鲁伊等人开展实验时,塔勒等人模型的所有预测均得到证实。也就是说,被试的反应表现出同化偏差,在紧接一次长棍试验后的试验中更倾向于回答“否”,展现出增强对比与滞后效应,并在多稳态 k 值处表现出随机切换。因此,被试的想象性动作可通过控制参数 k(其值由当前棍子长度及前一试验的棍子长度与反应共同决定)与集体变量 V(x) 之间的相互作用来解释。该模型在无需诉诸动作心理表征的前提下,准确解释了该想象过程。然而,这是一个表征饥渴型任务:它涉及对动物当前并未互动之事物的判断。

此处有必要对范鲁伊等人的研究作几点简要评论。第一,这是对那些声称激进具身认知科学只能解释最低限度认知行为、注定无法解释表征饥渴型任务者的回应之开端。这一想象任务显然属于表征饥渴型:它要求被试推理一项他们尚未采取、且无法感知的动作。然而需注意的是,这只是对克拉克与托里比奥所提出批评的初步回应——通过实例表明,激进具身认知科学并无原则性理由无法解释“真实认知”。

激进具身认知科学究竟能超越最低限度认知行为多远,仍是一个开放性问题。我们尚需拭目以待。第二点评论是:在重要意义上,这构成了对比尔事后建模(post hoc modeling)的一种改进。在比尔的模型中,智能体首先被构建出来,动力学模型则是在事实发生后才建立的。使用模型事后描述现象本身并无特别错误,但如果像范鲁伊等人那样,能用模型生成后续实验的预测,则更具说服力。我将在第5章详尽讨论这一点。最后,请注意,该任务既是表征饥渴型的,又大概率至少部分涉及背侧通路。若该任务是一项涉及真实动作(如真正去拨动远处物体)的知觉任务,它或许确实需要背侧通路活动。但此非知觉——它是对尚未发生的某事的想象。并且由于被试确会报告他们的想象,大脑活动并非如典型背侧通路活动那般处于无意识状态。这是“为行动之视觉”还是“为知觉之视觉”?它似乎两者兼具;无论其在多大程度上属于“为知觉之视觉”,它都使诺曼所提出的将激进具身认知科学限定于非表征饥渴型背侧通路的主张陷入困境,同时也使惠勒所依据海德格尔哲学提出的表征性与非表征性意识模式之区分陷入困境。

2.7 小结与前瞻

本章旨在阐明激进具身认知科学究竟为何物。我尝试从两个方面对此加以说明。

第一,我论证了它属于一种非表征性心理学传统(nonrepresentational psychology),该传统涵盖美国自然主义(American naturalism)、行为主义(behaviorism)与生态心理学(ecological psychology)。这一传统独立于另一条自奥古斯丁(Augustine)经笛卡尔(Descartes)延续至今、通向当代计算主义认知科学家的表征主义传统(representationalist tradition)。这表明:激进具身认知科学并非仅仅是当下“情境化、具身化”运动的激进延伸;相反,具身认知科学实为一种将美国自然主义计算主义强行结合的尝试。

第二,我通过实例来展示激进具身认知科学的内涵:比尔(Beer)以动力学建模的人工智能体,以及范鲁伊、邦格斯与哈瑟拉格(van Rooij, Bongers, and Haselager)对想象性行动(imagined action)的动力学解释,共同表明——激进具身认知科学可将认知解释为脑–身–环境系统(brain–body–environment system)的展开过程,而非“心智体操”(mental gymnastics)。

然而,人们仍可提出反驳:诸如比尔、以及范鲁伊、邦格斯与哈瑟拉格所构建的模型,实际上仍向其所解释的智能体大脑赋予了表征。(Chemero 2000a 指出了此种可能性;Markman 与 Dietrich 2000a,b 则明确提出了这一主张。)此类论证实质上等同于宣称:非表征性心理学(包括激进具身认知科学)在原则上是不可能的。

接下来的数章(第3、4、5章)将详尽阐述并回应此类论证。敬请留意:其中的哲学讨论将颇为艰深(the philosophy gets rather thick therein)。

原文链接:https://uberty.org/wp-content/uploads/2015/03/Anthony-Chemero-Radical-Embodied-Cognitive-Science-Bradford-Books-2009.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🔹 章节主旨
  • 🔸 一、核心定义与三重主张
  • 🔸 二、历史定位:并非“激进化的ECS”,而是ECS的“稀释版”
  • 🔸 三、核心分歧:表征在解释中的角色
  • 🔸 四、两个关键实例:RECS 如何解释认知?
    • ▶ 例1:Beer(2003)的仿真机器人
    • ▶ 例2:van Rooij et al.(2002)的“想象拨棍”任务
  • 🔸 五、本章结论与后续指向
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档