具身认知(Embodied Cognition)是一个迷人的认知科学领域,它强调身体在我们的思维和认知过程中所扮演的关键角色,而且,具身认知也是当前的 AI 还学不会的知识。认知活动并不只在大脑中“孤立”地进行,而是与身体状态、感知-运动系统、具体情境和社会环境紧密关联。
在具身认知的视角下,身体不仅是一个被动接收信息的工具,更在认知生成和信息加工的过程中发挥积极的作用。传统认知主义(Cognitivism)往往将心智视为与身体和环境相对独立的信息处理系统,关注符号操作、算法和内部表征等。随着实验结果和对真实场景中认知活动的观察,学者们发现这样“头脑—符号—计算机”的类比有一定局限性:它忽略了身体与环境在认知中的作用,也难以解释诸如身体动作、情绪、社会互动等对思维的影响。
为什么具身认知是当前 AI 的挑战?
AI 缺乏身体:目前的 AI 主要在虚拟环境中运行,没有像人类一样的身体,无法通过身体与环境互动,获得具身经验。
具身认知复杂性:具身认知涉及到身体、环境和认知之间的复杂互动,AI 需要建立复杂的模型来模拟这些互动,这具有挑战性。
数据限制:目前 AI 主要通过大量数据进行学习,而具身认知相关的真实世界数据相对有限,这限制了 AI 在具身认知方面的发展。
一、具体说,什么是具身认知?
既然是具身认知,概念分析很难讲明白,举几个具体的例子:小时候有一辆带辅助轮的自行车,骑着玩了一两年,拆掉辅助轮才发现,原来我根本不会骑自行车。大胆试几次,摔倒几次,突然有一天发现掌握平衡了,才发现真正骑自行车和骑带辅助轮的自行车相比简直是“飞一般的感觉”。
为什么我们学会了骑自行车时保持平衡?这不仅仅是因为我们学会了如何控制方向和踏板,还因为我们的身体与自行车形成了一种“具身”的关系。《飞驰人生》上说,“呼应上了”。这种”呼应“很难言说,AI 讲得再仔细,也只有你自己骑在自行车上才能“把握“这种平衡。
再举一个具身认知和非具身认知的例子,有一天晚上福尔摩斯带着华生到郊外去宿营,福尔摩斯夜里把华生给推醒了:
福尔摩斯:“你现在看到了什么?”
华生:“我现在看到了星空。”
福尔摩斯:“那意味着什么?”
华生:“从神学上看这个星空代表着上帝创造宇宙的构思是如何宏大;从哲学上看那就是宇宙是如此浩瀚,又是如此有序;从文学上看那一颗颗星辰都代表着一个个的神,满天其实都是诸神。”
福尔摩斯实在受不了了,“你这个笨蛋,我们的帐篷被别人偷了。”
华生从抽象的角度来理解星空,他的思考更多地基于“记问之学”(通过记忆、询问、深度思考来获取知识),这些学问都相对抽象,与他的直接身体体验 联系较少。他的“洞见”是间接的,象征性的,缺乏直接的身体参与。
福尔摩斯则完全从具身的角度出发,他更关注实际的、与身体相关的威胁。他的理解是直接的,具象的,并且与身体的行动和感知密切相关。
二、高阶的具身认知与智慧
高阶的具身智能不再只是“骑自行车”或者“学游泳”,而是基于生命体感的智慧。《AI 时代的教育》第三章深入探讨了智慧(Wisdom),并将其确立为教育的持久目标,智慧(wisdom)包括但不完全等于智能(intelligence)。
书中探讨了不同文化和哲学传统中对“智慧”的不同理解(见:《AI 时代的教育》社群共读一览),例如:法语中的“Sagesse”强调道德或哲学教义所提出的更高生活理想;希腊语中的“sophia”强调认识到自己的无知;藏传佛教中的“prajñā”和“jñāna”强调对所有事物和事件的精确辨别;印度教将智慧与实现解放联系起来;伊斯兰教中的“Hikma”被理解为知识和理解,以及滋养精神或智力的方式;道教将智慧定义为遵守“三宝”:慈、俭、不敢为天下先。书中指出:智慧不仅仅是知识的积累,还包括实践、经验和深刻的反思。
智慧必定不是公开的、AI轻易就能掌握的文本知识。“道常无名”,真正的智慧必定是某种很难转化为文本的知识,“吾不知其名,强字之曰道”,它不是你听AI说的也不是你从哪读到的,而是你自己通过对生活的观察、通过切身体验积累的东西,是尚未数据化的内容,是你的体感。
庄子举过很多这方面的例子:庖丁解牛,他讲了自己解牛却目无全牛,梁惠王悟出了“养生”之道;郢人匠石,运斤成风,他的朋友拿白泥涂抹了自己的鼻尖,匠石随手挥斧削掉白泥,朋友毫发无伤;这个朋友离开后,匠人却再也不敢表演这个特技——换了搭档,眼耳鼻舌身意,都不一样了。
还是举福尔摩斯的例子:有一次,破一个案子的时候,探长已经逮捕了一个陌生人,并且已经搜集了很多不利于这个人的证据。这时候,福尔摩斯跟格雷高里探长有这么一段对话:
探长:有没有其他的什么要点你要想提醒我注意的呢?
福尔摩斯:那天晚上狗的反应很有趣。
探长:那天晚上狗没有什么反应啊!
福尔摩斯:有趣的地方正在于此。
案子破了以后大家发现,警察忽略的一个最重要的线索就是狗没有叫。如果是这个被逮捕的陌生人作案的话,他进到屋子里,狗是一定会叫的。探长的思路被一个个证据牵着走的时候,他忽略了这个特别重要的信号:狗没有叫。
而当福尔摩斯提醒他要注意狗的反应的时候,他说“狗没有什么反应”——当探长这样说的时候,他不知道这是一个信号,是一个对细节的高阶观察能力。
福尔摩斯不仅关注明面的证据,还关注缺失的证据,例如“狗没有叫”。他的思维模式是整体的,注重联系,能够将看似无关的线索联系起来。他善于观察细节,并且能够从细节中发现重要的信息。
三、具身认知的思想发展
现象学和存在主义哲学家是我个人非常喜欢的一支西方哲学,这支思想很注重“此在(Dasein)”的“上手”(Zuhandenheit)认知。
胡塞尔是现象学的奠基者,他在分析意识结构时,区分了作为“物理客体”的身体(Körper)和作为“活生生的身体”或“体验到的身体”(Leib)。前者是客观世界中的物理实体,可以被度量、观察;后者是个体在第一人称经验中所“直接活出”的主体性身体。
“我们认识锤子的方法不是盯着它看,而是拿起来用。”——海德格尔
海德格尔使用“此在”(Dasein)来指称人之存在的独特方式。他认为,“此在”并不只是纯粹的思维主体,而是总是被投射到一个具体的存在境域中(“Befindlichkeit”,在世界之中),带有现实的身体、情感、历史、文化等多方面的限制与可能性;在《存在与时间》中也提到“上手”(Zuhandenheit),即我们日常中与工具、环境的互动往往先于理性思考和理论建构,而这种互动是以身体操控和感知为核心的。
在《知觉现象学》(Phenomenology of Perception)中,梅洛-庞蒂提出“身体主体”(body-subject)的概念,作为胡塞尔的关门弟子,他把胡塞尔区分的Leib(活生生的身体)视为认识主体最原初、最根本的维度:我们只能通过身体所提供的视角、触觉、平衡感等等,来“展开”对世界的各种理解。
最近在读波伏娃的自传《清算已毕》,存在主义者的字句真的能给人力量换个角度看问题:
“我的生活之于我,如此熟悉又遥远,它定义了我,而我又在它之外。如此怪异,这究竟是怎么回事呢?它正如爱因斯坦的宇宙一样,既无限又有限。人生是无限的,它跨越时空,直到世界的本源及它的边缘。此时此刻的我,既是世间一切的结果,也体现了整个宇宙的状态。”——《清算已毕》
我也看到胡塞尔系以外,萨特和波伏娃也相关的表述,尤其是波伏娃,作为女性主义的先驱,提出,“女人并非天生就是女人,而是被塑造成女人的(One is not born, but rather becomes, a woman)”;女性并不是被身体“钉死”,而是可以通过对身体的重新理解和实践,拓展存在的边界。
这些哲学家的思想不仅在哲学内部产生了深远影响,也为当代诸如“具身认知”“身体现象学”“身体社会学”等研究提供了方法论与理论参考。例如,梅洛-庞蒂关于“身体-主体”的研究常被视为与“具身认知科学”遥相呼应的先驱。
四、AI 与具身智能
AI 是否能真正掌握具身认知核心,还取决于研究者是否能给它足够的身体化交互机会和对情境的深层学习算法。眼下,硬件和算法都在进步,“宇树(Unitree)”等机器人公司提出了“世界模型(World Model)”的概念,让机器人带着传感器体验物理规律,让 AI 根据真实世界的物理”体感“,但仍然未达到让全世界都耳目一新的“DeepSeek Moment”。人类的身体不仅是一个物理实体,也是承载情感、社会互动、动机与目的的“场域”;具身认知强调的正是这种“从身体出发”去建构和理解世界的过程。
是否能让AI真正获得具身认知?
这不仅取决于算法和数据,也取决于我们能否将AI系统深度整合到丰富的感官和真实环境之中,并塑造能灵活适应、动态学习并产生情感联系的“身体—环境”交互体系。
当前的研究有了初步探索,但要想从根本上突破,还需在硬件传感器、分布式学习策略、多模态情境建模乃至对“意识”与“体验”的哲学探讨方面取得重大进展。
总之,“具身认知”对 AI 而言既是一个巨大的挑战,但这也是人类之所以为人类的价值和意义。它提醒我们,智慧并不仅是“大脑”或“算法”的事情——国际象棋初学者的水平跟智商很有关系,但是国际象棋大师的水平跟智商关系很小,是由训练和比赛经验决定的,智慧是从身体出发、深度融入现实世界的过程。
领取专属 10元无门槛券
私享最新 技术干货