首页
学习
活动
专区
圈层
工具
发布

当AI步入科学深水区:默会知识的转化难题 | 社会科学报

默会知识在科学实践中普遍存在,支撑着人类的科研活动。如今,人工智能驱动的科研被视为继实验、理论、计算、数据驱动后的科研第五范式,然而,人类科学家掌握的默会知识在人工智能技术中仍难以实现,而且,当下多个学科和领域的交互进一步加大了理解和应用默会知识的难度。在此背景下,如何实现默会知识的转化?

原文 :《科研第五范式中默会知识能否转化》

作者 |华东师范大学教授    朱  晶

图片 |网络

科学发现是人类极具创造性的活动,人类科学家的哪些能力难以被人工智能(AI)科学家替代?AI与科学发现的交叉汇聚历史,或许能为这一问题的解答呈现出别样的视角。从谷歌的AI Co-scientist、斯坦福大学的Virtual Lab,到上海人工智能实验室开发的VirSci虚拟科学家系统,AI科学家的发展正在迅速改变人类科研范式和合作路径。2024年被视作AI结合科学的里程碑式元年,诺贝尔物理学奖和化学奖均颁给了与AI相关的科学研究,分别成为科学驱动AI与AI驱动科学的典范。然而,从人类科学家与AI协作的AI Co-scientist,到全部由虚拟AI科学家进行合作研究,这些新进展预示着,AI在科学研究中的角色将从辅助工具向自主研究者转变。如果这些AI科学家系统的发展和应用不可避免,那么在极具人类创造力的科学发现领域,人类智能与机器智能的根本差别在哪里?

澄清三类潜在的误解

在讨论这个看似宏大的问题之前,我们先澄清三类潜在的看法。第一,AI技术并不等同于大模型和生成式AI。大语言模型带来的热度容易让我们忽视AI的历史。事实上,科学家在过去几十年从科学原理上对AI已经进行大量艰辛探索。第二,AI技术不只是探索纯符号空间和语言。目前的AI科学涵盖视觉、空间、认知推理、编程、数学等很多基本领域,希望突破数据统计局限,通过小型任务实现通用AI。而且,科学发现中使用的往往是面向科学研究的专属模型,而非面向日常经验的通用模型,比如化学和材料领域的OpenMolcas,地球科学领域的ORBIT,用于气候和天气预报的NeuralGCM。第三,AI与科学的结合并非近些年才发生。用于科学发现的AI技术,从AI形成之初便已开始。从20世纪50年代起,科学计算、AI和科学理论拓展这三条线索始终相互融合。除了以深度学习、强化学习为代表的AI在技术上实现突破,科学研究自身发展所需要的哪些人类智能,(至少是短期内)难以被AI替代?

强默会知识的内在视角和个体取向

波兰尼于20世纪中叶提出默会知识概念。与可用语言文字来表达的明述知识相对,默会知识是知道但不能用语言文字来表达的知识。在默会知识概念被提出后,全球学界围绕默会知识及相关问题展开诸多讨论。默会知识研究专家郁振华教授主张建构厚实的认识论,提出亲知和能力之知是强默会知识的两种基本形态。虽然明述知识和默会知识在人类实践活动中相互交织,但归根结底,明述知识依赖于默会知识。

根据这一主张,在科学发现的实践过程中有哪些属于强默会知识?默会知识在科学实践中普遍存在,与身体有关的技能和技巧,比如实验和工程操作能力、生物工程和系统生物学中的计算建模能力等,都属于默会知识的维度,包含亲知这一形态。尽管实验操作和建模的部分功能可以被AI替代,但是人类科学家所掌握的这两项技能并不是简单重复的机械性操作,还依赖大量来自内在视角和个体取向的默会知识,比如,判断什么是可用的数据、如何选择合适的参数进行建模、如何将可用的数据反馈于实验改进或理论修正等,都需要这类默会知识的支撑。作为推进AI与科学结合的科学计算,其中的建模也蕴含和传统科学研究不一样的默会维度。科研人员通过建模活动获得全局性知识,比如空间理解能力、内在想象能力与外在模型能够逐级交互,从而可以默会性地理解模型系统性的运作方式及一些突现状态。

以上讨论的是与科学发现的认知价值有关的默会知识。当涉及复杂科学发现中渗入的非认知价值时,机器更难处理。在当下科学研究对复杂现象(比如气候、环境等)的探索中,人类科学家所持有的社会、伦理等非认知价值,本身就能作为经验证据的一部分,进而在科学探索中扮演证据角色。非认知价值有更强的内在视角与个体取向,很难被准确编码为机器运行所需的语言。

正因如此,AI与科学的结合虽有70多年的历史,但AI技术所利用的依然是明述知识——可明述的逻辑符号、数据和图像,所解决的科学问题分别是知识或定律的复现、数据关系的分类和处理、更大体量和更多维度的科学数据处理。AI技术发挥的作用主要在于提升科研效率,其仍然难以模拟科学发现的真实实践。

理论智慧中的默会维度

除了上述实验、数据与理论、价值的交织中蕴藏着默会知识,以对理论的深度理解和说明为特质的理论智慧,在当下的科学研究中也有很强的默会性。它包含两个新维度:一是利用理论进行推理,二是利用理论并结合数据进行建模和模拟。可见,它既有亲知,又有能力之知。

新近的科学哲学研究表明,理论不仅是科学探究的目标,还是科学家开展探究的工具。这种科研方式与AI结合科学时所采用的纯数据驱动存在差异,既不单纯依赖统计信息,又不同于在高维空间与高度复杂的数据中寻找模式。基于理论进行推理的实践能力,在颠覆性的科学创新中扮演重要角色。在一些学科中,理论与实验的先后次序并不重要,利用理论进行推理比获得理论更重要。以合成化学为例,其大量研究工作不仅是为了探讨理论,而是为了拓展合成范围或者实现合成目标。在这个意义上,理论知识不仅仅是一种可明言的知识或者命题性知识,相较于实验操作等技艺,理论推理这一实践有更强的默会性,因为它涉及理论与操作技艺相互反馈、迭代进化的过程。比如,化学研究中的逆合成原则和轨道对称性守恒原理,看起来都属于明述知识,但是科学家要学会如何使用这些理论或概念进行推理,并非易事。

人类科学家所掌握的这些强默会知识,对AI技术来说还较难实现。专门用于评估大型语言模型在科学领域推理能力的高难度基准测试GPLA中,虽然AI的准确率达到87.7%,而专家的准确率只有81.3%,但测试题目并不能反映人类科学家的理论推理能力。以化学类题目为例,GPLA给出的问题是根据化合物的特征信息来推测化合物在元素周期表中的位置。回答该问题并不需要AI进行理论推理,也不涉及复杂的化学反应原理与动态过程。

相较于AI模型,人类科学家提出和使用的物理模型或数学模型,发挥着沟通科学理解的功能,比如立体化学中的构象和DNA 结构模型可以帮助我们理解抽象概念。人类科学家建立和使用模型的过程,本身是一种富含强默会维度的理论实践,比如,化学家利用结构模型对化学现象进行解释并推理、预测、设计和干预化学反应过程,其研究活动的每一环都有默会维度的支撑。因此,基于物理模型、数学模型等科学模型的科学计算,虽然在AI驱动科学发现的进程中发挥了重要的桥梁作用,但是理论实践在科学发现史中发挥的核心价值还远未被AI技术替代。

提供理解和构建理论的新方式

默会知识不仅难以被明确地记录和传达,还难以被有效地传授给他人。当下的交叉科学还涉及多个学科和领域的交互,这进一步加大了理解和应用默会知识的难度。在人类科学家与AI的交叉合作中,如何能够既发挥人类的独特性,又充分利用AI的优势,实现默会知识的转化?

在科学探究活动中,明述知识和默会知识相互依赖、相互促进。人类科学家在科研实践中很少独立使用某种方法或研究进路,计算模型或数据密集模型很少被孤立使用,而往往被整合进更大的研究背景中。与历史上的科研范式变革一样,AI技术并不一定要替代理论驱动的科研方法,而是要提供一种新的理解和构建科学理论的方式,这在当下的分子生物学与AI结合、物理化学与AI结合上已初现端倪。一条可行的路径是,将机器学习与已有的过程机制模型紧密结合,在发挥机器在数据处理和模式挖掘方面优势的基础上,结合人类科学家的理论推理能力等默会维度,使机器学习的预测方式和预测结果成为理论构建的一部分,促进理解并构建新的科学理论。

在科学解释或理解的实践中,机器学习等方法的最吸引人之处在于其与各种方法结合的可能性。AI科学/智能科学(对AI自身展开的科学研究)也存在两种方法论之争,分别是经验主义与理性主义。科学智能与智能科学的交叉能够促进双向理解,发展各自的理论或方法。人类科学家可以利用AI技术理解自然现象、拓展科学理论,而在这一过程中产生的特征化的结构数据又能反过来拓展AI模型结构空间,促使AI科学在科学和技术上实现根本性进步。

文章为社会科学报“思想工坊”融媒体原创出品,原载于社会科学报第1969期第5版,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。

本期责编:程鑫云

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OPVEFCsSeqbB75PH2NgeGiEw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券