首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Graphs are maximally expressive for higher-order interactions

Graphs are maximally expressive for higher-order interactions

作者头像
CreateAMind
发布2026-05-20 13:51:28
发布2026-05-20 13:51:28
650
举报
文章被收录于专栏:CreateAMindCreateAMind

Graphs are maximally expressive for higher-order interactions

图对于高阶交互具有最大表达能力

https://arxiv.org/pdf/2602.16937

摘要

我们证明,基于图的模型完全能够表征高阶交互,并且长期以来一直被专门用于此目的。这与近期“高阶网络”文献中的一种常见主张形成对比,该主张认为基于图的表示从根本上仅限于“成对”交互,需要超图表述来捕获更丰富的依赖关系。我们通过强调两个常被忽视的事实来澄清这一问题。首先,基于图的模型并不局限于成对交互,因为它们天然能够容纳同时依赖于多个相邻节点的交互。其次,超图表述是更一般的基于图的表示的严格特例,因为它们对相邻元素之间允许的交互施加了额外约束,而非扩展了可能性空间。我们表明,通常被归因于超图的关键现象(如突变)原则上均可使用图模型精确复现,即便是局部树状图亦然,因此并不构成一类本质上必须依赖超图模型的现象。最后,我们认为,文献中有时所声称的超图在应用中的广泛相关性缺乏证据支持;相反,这很可能源于一种误解,即认为网络模型无法容纳多体交互,或认为某些现象只能通过超图来捕获。我们主张,明确区分由图参数化的多元交互与定义这些交互的函数,能够为交互系统的建模提供一个更为统一和灵活的基础。

I. 引言

近年来,通过所谓“高阶网络”(HONs)对相互作用系统进行建模的兴趣急剧增加,其特征是用超图参数化涉及两个以上元素的相互作用[1–8]。该文献提出将超图作为复杂系统一般理论的基础,声称其具备基于图的表述所无法企及的解释力。在此基础上,部分学者主张图应被超图全面取代,作为最基本的表示对象[1, 7, 8],从而将基于图的模型降格为特例。所谓超图的严格优越性建立在以下主张之上:

  1. 图仅编码“成对相互作用”。
  2. 超图编码“群体相互作用”,即包含两个以上元素、不可分割的相互作用单元,无法由图表示。
  3. 许多系统更适合用“群体相互作用”建模,因而更适合用超图。
  4. “群体相互作用”会催生基于图模型无法解释的新现象。

这些主张遵循不同的推理脉络,并未实质性介入统计物理学中长期存在的将超图用作二分因子图的传统[9, 10]——该框架是约束满足理论[9, 11]、纠错[12, 13]、自旋玻璃[14]、统计推断[15]、社区发现[16]、算法困难性[17]以及非平衡无序系统[18]的核心。

高阶网络文献中的“成对相互作用”概念,混淆了图的结构(边连接节点对)与定义在这些边上的相互作用的函数形式。这种混淆暗示:若系统由图表示,则节点与其邻居的相互作用必然可分解为独立或可加的成对项。然而,图定义的是邻域,即与给定节点相邻的节点集合,而非相互作用本身。定义在这些邻域上的函数可以是任意复杂且多变量的,能够以非线性方式同时依赖于所有相邻节点。在本研究中,我们表明,一旦厘清这一混淆,基于图的表述将被证明在表达能力上并不逊色,事实上反而比基于超图的表述更为一般。

具体而言,我们证明,一条超边意味着某种相互作用在一组固定节点之间展开,并以集合内每个成员一致作用的方式发生。因此,不同超边间的相互作用最多仅以相加或其他简单方式组合。超图由此对相互作用施加了基于图的模型所不予限定的结构约束,这使得超图模型成为限制性更强的一类。由此可得,在超图模型中可观测到的每一种现象,在基于图的模型中也必然可观测到。

我们考察了通常被唯一归因于超图模型的显著现象学主张,包括同步[19]、种群动力学[20–23]、流行病传播[24, 25]和平衡自旋模型[26, 27]中的突变,并表明使用渐近局部树状的基于图的表述可获得完全相同的行为。我们还表明,针对动力系统的超图框架[28–30]可用多层网络[31, 32]进行等价表述,从而无需使用超图。除理论论证外,我们强调支持基于超图模型实用性的经验证据不足:图数据几乎从不包含超出邻域的信息,且极少显式编码交互规则。此类信息通常是隐性的,因此必须通过统计方法进行推断。此外,随着交互群组规模的增大,这些交互越来越可能呈现出稀疏的内部结构,而此类结构可由标准图模型自然地表示。因此,采用超图表述需有明确依据,而非将其视为默认选择。

本文结构如下。第II节证明图并不局限于“成对交互”。第III节表明超图表述是图模型的特例;第IV节说明如何将任意特定的超图表述转换为多层网络,但反之则不成立。第V节探讨曾被归因于超图结构的现象,并证明它们可由局部树状图完全复现。第VI节讨论所谓超图模型具有普遍相关性这一主张缺乏经验证据的问题;第VII节探讨多元交互可约性的一般性问题。第VIII节为最终讨论。

II. 图界定相互作用的范围

高阶网络文献频繁断言图仅编码“成对相互作用”,却未精确定义该概念。相反,图中的边常被隐含地假定为代表两个节点之间孤立的“相互作用”的具体实例,且独立于所有其他边。据称,每当此约束不成立时,图的表示便会变得不充分。然而,这一解释并不符合网络模型在过去数十年间、于多个科学领域中实际能够且已被定义的方式。

作为示例,请考虑柯尼斯堡七桥问题这一基础性案例[33],该问题要求我们寻找一条恰好穿越城市中每座桥一次的路径。所涉及的桥梁本身既非图,亦非超图。然而,将其描述为图却具有价值:欧拉表明,这一抽象使我们能够断言:若具有奇数度的节点超过两个,则该问题无解。需注意,即便在此简单示例中,结论也并非源于对孤立节点对的考察,而是基于对节点度数(即节点邻域大小)的考量。

许多现代城市包含具有三个或更多端点的桥梁,但这并不会自动使网络表示变得不充分。若要求桥梁端点之间的每条路径均须恰好通行一次,则每座多向桥可被建模为一组独立的边,从而使欧拉的结论保持有效。

若每座多向桥无论进出端点如何,整体仅允许通行一次,则情况有所不同。表示此约束的一种方法是将每座多向桥视为一个附加节点,将系统转换为二分网络,其中每个桥梁节点均须恰好被访问一次。该表述虽仍为图,却与系统的超图表述完全等价。

然而,这并非唯一选项。我们可通过保持端点间连边的独立性,同时为每条边分配颜色并要求每种颜色仅使用一次,来保留原始网络结构。若对应于给定多向桥的所有边共享同一颜色,且不同桥梁具有不同颜色,则该染色边模型在保持相同形式的成对网络抽象的同时,亦能给出该问题的等价表示。

作为进一步示例,考虑在个体间传递的实物,例如一张美元纸币。每当两人相遇,纸币便可能易主,而对该过程建模自然会导出网络上的扩散方程。现假设在某些情况下三人同时会面。在此类聚会中,纸币的当前持有者可将其传递给另外两名参与者中的任意一人,但无法同时传递给两人。

三人会面的出现是否必然需要超边?并非如此。更自然的方法是用三条成对边来表示三人交互,其中每条边上的传递速率相应降低,以反映在共同会面期间纸币仅能传递给两位邻居中的一位。可选地,我们可将所有源自此类三方交互的边视为网络的独立一层,并对该整层的扩散速率进行全局降低。该方法颇为优雅,因其完整保留了扩散过程的确切数学表述,且仅需对边的权重进行调整。

下文我们将证明,上述示例中的观察结果可以被形式化并加以推广。更具体地说,我们证明定义在图上的相互作用并不局限于成对相互作用。一般而言,单条边 (i, j) 的存在所确定的至多是:当其他节点状态保持不变时,节点 j 的状态与节点 i 之间是否存在非零的条件依赖关系(对于无向图则反之亦然)——任何更具体的内容只能在特定函数定义的背景下进行评估。简言之,图规定了哪些节点可以相互作用,但对这些相互作用所采取的形式未作任何说明。

图被定义为节点的集合 V = {1, ..., N},以及由节点对构成的边的集合 E ∈ V × V。邻接矩阵,

基于这些邻接集,我们可以进一步约束节点间的相互作用。以常微分方程组(ODEs)作为概念验证(如附录A所讨论,所有后续论点均直接适用于上述其他情形以及平衡态系统),我们通常可以写作

为简化符号表示,此处省略了显式的时间依赖关系。我们指出,该表述保留了完整的表达能力,因为当采用完全图时,我们即可恢复一般情形。这表明图对节点间的相互作用施加了约束,但并未定义这些相互作用本身[35]:节点上的函数仅依赖于节点自身的值及其邻居的值(见图1)。

唯一能明确界定为“成对”的动力学类型是节点函数可分解为独立项之和的情形,且每项仅涉及两个节点:

此类具有成对动力学的模型仅出现于本质为线性的系统,或通过围绕动力学零点进行线性化而大幅简化的系统中。若所得模型在现象学表现上存在局限,这并非源于底层图框架,而是由叠加的线性化处理所致,该处理可能导致系统被过度简化[36, 37]。因此,此类成对模型实属例外,而非常态。

历史记录充分印证了我们的论点,因为网络模型长期以来一直采用不遵循此种成对分解的多元函数。

或许令人惊讶的是,早在140多年前首次使用“图”一词指代网络的文献[34]中,便已提及节点上阶数与节点度数一致的非线性多元函数的可能性。

较近时期,在最早的基于图的模型中,包括Kauffman于1969年引入的随机布尔网络[38],该模型作为基因调控的简化模型。此模型描述二值变量 xi∈{0,1}(即基因处于表达或未表达状态),其确定性演化规律如下:

对于每种输入组合,其输出均均匀随机选取,且各节点相互独立。在随后的几十年中,此类模型的诸多变体已被广泛研究[39, 40]。例如,针对同一类基因调控模型,一种可认为更为现实的变体是嵌套 canalizing 函数[41],其定义为:

其中 z 和 y 分别为所谓的 canalizing 值与输出。该函数旨在模拟转录因子如何结合至DNA的线性区段,同时受到抑制剂与激活剂有序层级结构的影响。此外,还存在多元相互作用的其他表述形式,它们可在连续值与时间域上推广任意布尔函数,例如基于希尔函数[42]的模型。对于涵盖生物学[43, 44]与社会学[45]领域以及机器学习[46]的广泛系统类别,最常用的多元相互作用模型之一是阈值函数,其形式为:

其中参数 k>1。在此情形下,没有任何单个节点能独立于其他节点确定感染状态。其他类型的协调包括复杂传染的不同模式 [53–57]、相互依赖传染 [58],以及三元渗流 [59],后者表现出复杂的动力学行为,包括倍周期分岔和通向混沌的路径,且该列表可随意扩展 [60]。

鉴于图上存在如此多样且众所周知的多元相互作用实例,关于图仅编码“成对相互作用”的主张无法成立。

关于“成对相互作用”的另一种——尽管是循环论证的——定义是:任何可由图表示的相互作用均为成对相互作用,而“高阶相互作用”则是那些需要超图表示的相互作用。然而,这一定义预设了它们构成了截然不同的类别。在下一节中,我们将证明超图与图支持同一类相互作用。

III. 超图约束而非推广相互作用

HON文献将基于图的表述与基于超图的表述进行对比,后者是一种数学推广,其中边(或“超边”)可连接任意规模的节点集合,而不仅限于节点对。作为纯粹的组合对象,超图是对图的推广:在相同节点集上,可能的超图数量多于图的数量。据此,人们或许会得出结论:基于超图的模型能够表达图所无法实现的相互作用。然而,这一推理混淆了组合结构与函数表达能力。鉴于图仅约束相互作用的定义域而非定义相互作用本身,通过超图指定额外结构只会施加进一步的约束,而非扩展相互作用的空间。简言之,超图模型是基于图的模型的特例,而非推广。下文将对此点作详细阐述。

与邻接矩阵不同,超图由邻接张量表示,

因此,由式 14 定义的任何模型均可还原为式 4 的基于图的模型,并附加了一个约束条件,即邻接关系必须对应于投影团(projected cliques)。虽然特定的函数 fi可以被构造为反映由超图 λ 定义的邻接集,但这仅是一种建模选择;当此条件不成立时,超图结构并不提供额外信息。

此外,只要节点函数的结构由超图决定,这就对容许函数类施加了额外的约束。特别是,不仅必须区分邻接集,而且它们还必须在相邻节点间对齐以形成重叠团(参见图 2)。相比之下,通用的基于图的表述在函数形式以及函数自变量的连接方式上均放宽了这些要求。由于它不强制重叠团结构,因此在仍能表示任意复杂的多元函数的同时,允许更灵活的连接模式。下文我们将通过具体实例阐明这些差异。

其中,每个既有的节点组 c 都对一个多元相互作用项 hc 有贡献,该项以所有相关节点 xc的状态作为自变量。由此或许可以论证,第二类模型比第一类具有更大的表达能力(因为若所有超边均为节点对,则可还原为第一类),但重要的是切勿忘记,它们二者都只是式 4 中更为一般的基于图的模型的特例。此外,正如我们已提到的,存在多种广泛使用的基于图的模型的关键实例并不符合上述任何一个子族,因此利用其中任何一个来做出一般性论断是不恰当的。

尽管如此,人们或许仍试图论证:对于每一个基于邻接矩阵 W 的参数化,人们可以通过保持其他一切不变并将其替换为超图 λ 来获得一个更为一般的模型,正如式 19 对式 18 所做的那样,但这仅限于在特定语境下有意义(例如,尚不清楚这种构造如何应用于任意布尔函数、前文所述的嵌套 canalizing 函数或阈值函数)。然而,即使适用,这一论点的相关性也相当有限,因为我们总是可以摆脱这种特定的参数化,转而采用一种严格基于图且更为一般的参数化。更具体地说,作为示例,我们可以将以下基于图的模型与式 19 中基于超图的模型进行比较,

使得该模型无法再通过式 19 表达,因为入射于节点 5 的两条超边不再存在,而它仍可由式 20 描述。与图 3 的情况一样,同时将式 19 的超图模型标记为“高阶”,而将式 20 的基于图的模型标记为“成对”或“二元”,将是武断的。

需要注意的是,如果我们仅关注它们对应的图与超图参数化,而忽略提供变量间实际耦合的函数——正如仅考虑邻接结构时常见的情况那样——那么图 3 中两种情况之间的差异与相似性便不太明显。

在附录 A 中,我们阐述了上述考量如何同样适用于由哈密顿量描述的平衡态模型。

同样值得注意的是,在基于图的表述中,通过将边设为有向,可以以最大的一般性对非对称相互作用进行建模,因此若变量

函数的自变量出现,互反关系未必存在。然而,同一概念在超图中并不容易转换,因为这需要就如何界定一个组的顺序做出任意且更为受限的规定。

上述比较强化了核心论点:网络模型最一般的框架是包含在邻接关系上定义任意函数的图。超图表述非但没有推广该框架,反而构成了一个受约束的子族,要求邻接关系形成重叠团。若无强有力的经验证据表明真实系统符合此类约束,则没有理由优先选择超图表述而非更一般的基于图的方法。

IV. 多层网络推广超图

前一节表明,一旦考虑耦合函数,超图表述并未将相互作用空间扩展到图已支持的范围之外。在本节中,我们暂且搁置函数,直接比较参数结构本身。虽然超图通常无法从单一邻接矩阵中恢复,但我们证明多层图提供了一个自然且严格更一般的参数框架,其中任何超图均可被忠实表示。

事实上,即便在高阶网络(HON)文献[1–4, 6, 71]中也广泛认可:任何超图均可无歧义地表示为二分因子图,其中超边被映射为入射于变量节点上的因子节点。这一观察并非平凡,因为它使得超图可利用标准的图论工具进行分析。然而,正如第六节所讨论的,这种可能性在HON文献中常被轻描淡写。

同时,这种数学等价性依赖于节点集的扩展,且通常保持参数化的解释不变。因此,它并非唯一值得考虑的等价形式。下文我们将引入一种简单的基于图的构造,它不仅等价于超图参数化,而且严格地推广了它们。

超图推广了图的结构,因为从邻接矩阵 W 出发,人们并不总能唯一地恢复投影到其上的超图。换言之,对于由邻接张量 λ 定义的超图,我们通常有

上述事实代表了重要的建模机遇,因为它允许将每条超边(原本代表一个单一整体单元)推广为具有任意形状和权重分布的子图。

作为对上述推广的对照,人们可能会争辩说,可以用标注了超边的多层超图来推广多层图。然而,应用上述相同的论证意味着,这总是可以通过扩展的层分解映射回多层图。其结果是,不存在任何由超图(即使是多层超图)表示的结构是无法由单个多层图表示的。

超图的多层推广为我们提供了一种与上下文无关的方法,可将任何超图模型转换为基于图的模型,除了通过式 26 将 λ 替换为 W 外,不改变模型中的其他任何内容。例如,可以对方程 19 进行此操作,以获得一个完全不依赖超图的完全等价的动力学模型。这两种表述是相同的,区别仅在于邻接关系是通过张量还是多层矩阵进行编码,这进一步表明,基于此对“高阶”和“成对”的区分并不反映底层模型的实际差异。然而,不应忘记这种推广并非唯一,正如我们之前讨论的,通过向相互作用函数添加参数或改变其结构,还存在许多其他可能性。

V. 被错误归因于超图建模的现象学

高阶网络(HON)文献中的一个常见主张是,超图模型引入了基于图的表述无法触及的独特动力学类别 [1–4, 6, 7]。虽然前几节已经表明基于图的模型推广了那些通过超图构建的模型,但在本节中我们将独立地考察具体主张。我们表明,归因于超图模型的行为可以由缺乏任何团结构的基于图的模型精确复现,更不用说超边了;或者由多层图复现,而无需诉诸上述推广。

在 V A 节中,我们表明用于论证 HON 文献中许多主张的均场计算并未区分超图模型与基于图的模型。在 V B 节中,我们表明在同步和传染中报告的突变属于在基于图的模型中发现的同一类转变。在 V C 节中,我们表明生态系统模型的稳定性分析与超图结构无关。最后,在 V D 节中,我们表明一大类超图动力学可以被等价地表述为多层动力学的特例。

A. 均场计算的不适用性

文献中研究的基于超图的动力学模型的一种典型形式相当于式 19 的一个特例,即所有超边上具有齐次函数,亦即

在此类系统中,每个节点均以相同的方式与其他所有节点相互作用,而这种对称性常被用于将 N 个耦合微分方程简化为单个自洽方程,该方程对应于描述某一固定点或其他感兴趣吸引子处的某种全局平均的标量序参量。对于相当一类系统,这种对序参量的近似在热力学极限 N→∞ 下渐近精确。

此类建模假设与均场计算已被用于研究由超图参数化的各种动力系统,包括同步 [19, 61]、流行病传播 [25]、种群动力学 [20–23]、决策模型 [62]、三元渗流 [63] 以及平衡态自旋系统 [26, 27]。在此设定下观察到的行为已被用来声称超图会产生定性上不同的行为,而这种行为对于基于网络的模型而言是“不可见”的 [1, 4, 7],通常涉及序参量中的突变。

我们所做的关键观察是,存在简单的替代模型表述,它们并非基于超图,却映射到与式 32 完全相同的均场。例如,我们可以考虑一个具有邻接矩阵 W 的单层图,以及由下式给出的动力学

在 ρ=O(1/N) 的稀疏情形下,这种齐次均场代表了一种结果图呈局部树状(如图 3b 所示)的情形,因此在热力学极限下不存在任何团。然而,尽管式 27 和式 33 的模型具有不同的微观动力学,但就均场假设(mean-field ansatz)所捕捉到的范围而言,它们的宏观行为是完全相同的。因此,旨在表明超图模型会导致特定大尺度行为的此类分析实际上证明了相反的情况:超边(或“群体相互作用”)的存在并非必要——甚至无关——的要素。

B. 突变

式 27 和式 33 的模型映射到同一均场这一事实意味着,唯一相关的要素是那些考虑了多个邻居节点状态的多元函数 f。事实上,在许多模型中都已考察过突变的出现,在这些模型中,这些函数反映了与输入集合相关的独立事件的同时发生。也许其中最简单且最古老的例子是自举(k-核)渗流 [50–52],它与 Watts [45] 的阈值模型密切相关,该模型定义在二值状态节点 xi∈{0,1} 上的动力学如下:

该方程与标准渗流方程几乎相同,区别仅在于右侧被平方——这反映了动力学所规定的两个独立事件的重合。尽管不完全相同,其宏观行为可与自举渗流相比,因为如图 5b 所示,函数 F(S) 同样具有一个导致鞍点分岔和不连续转变的拐点。

上述两种情况均代表了这样的机制:由于对节点邻居间不同类型的协调提出了要求,从而产生了突变,而超图在其中未起任何作用。尽管这些过程在统计物理学和网络文献中非常重要且广为人知,但在 HON 文献中却几乎从未被引用。我们认为,那些声称归因于超图参数化的突变实例,仅仅是类似现象的其他实例,其中超图参数化在很大程度上是无关紧要的。我们将在下文考察具体实例。

  1. 同步

上述混淆最清晰的例子或许是文献[19]中的超图同步模型,该模型是对库拉莫托(Kuramoto)模型[66]的扩展,引入了多元项,定义为

均场计算的定义属性,特别是在齐次情形下,是它们不保留关于节点间相关性的信息。如果此类计算仅通过采用超图表述就能纳入相关性,那么这种局限性起初就不会产生。因此,结果动力学等价于无关联随机图上的动力学也就不足为奇了。然而,引人注目的是,这类论点一直被作为证据呈现,用以证明以超边形式存在的节点间结构相关性的作用。

同样的均场计算,或者等价地,在均匀混合超图上的模拟,一直被用于论证这些参数化在突变及其他现象中的作用,这不仅限于同步,还包括合作的种群动力学 [20–23]、流行病传播 [24, 25, 67, 68]、三元渗流 [63]、决策模型 [62] 以及平衡态自旋动力学 [27]。所有这些案例都存在上述相同的问题:所描述的行为可以通过定义了相同多元函数的类树图来获得,而超图结构不起任何作用。

几项研究也考察了超边间相关性的影响,通常是通过数值模拟或非均匀均场计算 [19, 29, 69–77]。然而,这些研究系统地忽略了与适当构建的基于图的表示(例如,定义在相同多元相互作用函数上的类树图或关联图)的比较,从而限制了关于超图结构严格必要性的结论。

更一般地说,正如在关键设定中早已确立的那样 [57, 78, 79],相关性的存在预计会影响图上广泛的动力学过程。然而,此类效应应被视为相对于邻居间多元协同相互作用的作用而言是次要的——这是一个可与团或超边的存在性分离的方面。尽管如此,HON 文献常声称超图指定的结构从根本上不同于通过在图中植入团 [1, 4, 7] 甚至局部类树构型所获得的结构,并且声称它们会产生定性上不同的行为。然而,目前这一主张在很大程度上仍缺乏实证支持。

  1. 传染

上述同一问题的另一个例子是文献 [24] 中的单纯形传染模型(simplicial contagion model)。在该研究中,作者将通常的复杂传染模型 [53–57](其中如果受感染的邻居超过阈值,邻居就会被感染)与一种超图模型进行对比,在后者中,仅当属于同一超边的所有邻居都被感染时,节点才会被感染。更确切地说,他们考虑了一个由马尔可夫链定义的连续时间 SIS 模型,

文献 [24] 的作者强调上述模型与通过图建模的模型之间的区别——但正如我们在前文多个示例中所示,这是一种没有实质差别的区分,因为完全相同的微观动力学代表了基于图的模型的一个特例,其中超边仅代表一种特定的构型。然而,正如同步的情形一样,文献 [24] 中描述的现象表现实际上与任何特定的超图结构无关,如下文所示。

与迄今为止考虑的其他模型不同,对于 SIS 模型,均场计算在热力学极限下并非精确,但捕捉到了整体的定性行为:与同步情形完全一样,F(S) 中的拐点产生了三个可能的不动点,以及涉及其中两个的鞍结分岔(见图 5d)。

如前所述,使用对以下感染率进行参数化的图 W,可获得相同的均场行为:

C. 生态系统的稳定性

在生态系统的背景下,文献 [80] 的作者考虑了一个由下式给出的模型上的种群动力学

其中,每一阶的 λλ 的元素均独立地从零均值、方差一致的高斯分布中采样。当多元项的方差发生变化时,物种共存的稳定性也随之改变。由于该设置完全符合均场假设的范畴,正如我们此前所讨论的,若在热力学极限下将超边替换为图,动力学将保持不变,因此稳定性的变化归因于相互作用中的多元乘积,而非特定的团结构。其他文献 [81, 82] 中出现的类似表述,尽管未必采用关于超图结构的相同假设,也同样适用上述观察。

另一个说明性例子是文献 [83] 的工作,其中分析了以下种群动力学的稳定性:

这种情况在概念上具有启发性,因为该模型是直接通过矩阵 W 进行参数化的(即通过二元网络表示而非超图)。尽管如此,它在 HON 文献中常被作为“高阶”效应的典型例证进行讨论 [1, 4, 7],这似乎与他们将该术语等同于超图参数化的核心主张相抵触,并凸显了该文献在使用“高阶”一词时反复出现的歧义,即该词既指代多元相互作用,又指代超图的使用。

事实上,值得一提的是,文献 [80, 83] 的作者既未提倡也未必认同 HON 文献中反复鼓吹的“成对”(基于图)与“高阶”(基于超图)的二分法。相反,他们比较的是涉及双变量和三变量函数的具体生物模型,这些模型在种群动力学的背景下具有直接的相关性。这种区分在那里尤为重要,因为与网络科学这一更广泛的领域不同,大多数传统生态模型仅考虑成对相互作用,通常采用式 5 的形式。然而,包括上述研究在内的众多研究已经证明,多元相互作用在生态动力学中可以发挥重要作用 [36, 81, 82, 84–88]。

尽管一些学者批评近期对高阶相互作用的关注 [89],但很少有生态学家会否认源于基本竞争效应的基本多元相互作用所起的根本作用。一个经典的例子是捕食者捕食多个猎物物种的情况 [36]。在食物网(有向图)中,这种情况通常通过从猎物种群指向捕食者种群的有向边来捕捉。尽管这些边因此仅连接两个种群,但捕食者的捕食能力有限,因此一个猎物物种的存在会降低了对另一个物种的捕食压力(表观竞争)。在物种 3 存在的情况下,物种 1 对物种 2 的捕食通常由如下形式的多元函数建模:

或其推广形式 [36, 37]。

我们要强调的是,我们的批评并非针对多元相互作用本身的相关性(我们认为这一点已得到明确证实),而是针对那种将多元依赖与需要超图参数化视为同义词的普遍倾向。

D. 多层动力学的特例

在本节中,我们证明了一大类基于超图的动力学模型——即那些在节点空间中表述为按阶次分辨的贡献(如式27)的模型——存在不依赖超图的等价表述。当动力学为线性时(如扩散过程),经典的加权二元网络通常已足够。在非线性情形下,可采用多层网络框架,通过“提升”至按相互作用阶次索引的层,随后自然投影回节点空间。因此,超图结构并非如通常所主张的那样唯一地“最一般化”[29]:相同的节点级演化可由更丰富的多层动力学类别来实现。由于该建模模式是许多高阶同步与稳定性分析(如文献[28–30])的基础,本视角在该背景下具有直接的相关性。

  1. 扩散

上述扩散情形是特意设为初等的:这种等价性是精确的,且源于生成元的匹配。之所以发生这种情况,是因为该示例坍缩为了一个加权图,而我们实际上使用的是将超边事件投影到成对跃迁的节点空间投影,而非霍奇意义下的高阶拉普拉斯算子 [92]。

有趣的是,我们可以将同样的基于投影的思路应用于 HON 文献中的一个核心设定,即高阶同步稳定性分析中使用的按阶次分辨的变分动力学,如下文所示。

  1. 非线性动力学

VI. 缺乏经验基础

网络和超图都不是现实世界的实体,而是用于模拟复杂系统的概念抽象。单一的现实系统通常可以用多种不同的方式来表示——作为网络、作为超图,或通过完全不同的数学框架。因此,表示的选择由偏好和实用性共同指导。在实践中,这需要平衡数学上的通用性、可解释性和经验支持 [35]。

历史上,基于网络的模型已被证明极其强大。将系统表示为网络是一种强有力的简化,但它使得应用一套丰富的分析工具成为可能。这些工具包括谱方法 [93]、度分布分析及相关生成函数技术 [94],以及图系综的表述 [95–98],等等 [99]。

如上所述,超图参数化对大规模相互作用系统施加了更具限制性的数学结构,而基于图的表述则倾向于提供更大的一般性。除了这种增加的结构特异性外,超图目前配备的一套成熟分析工具更为有限。尽管最近的进展已将系综方法扩展到了超图 [100–104],但这些方法尚未像经典图模型(如 Erdős–Rényi 随机图 [95]、配置模型 [97] 及其推广 [98, 105])那样发展完善或广泛适用。同样,图论中的许多优雅且一般的结果,如欧拉对柯尼斯堡七桥问题 [33] 的解答或巨分支分析的生成函数方法 [94],在超图理论中尚无相当的对应物,尽管存在一些专门的框架 [106, 107]。特别是,超图的基于张量的表述迄今为止在通往广泛有用的谱理论方面进展有限 [108]。未来的发展很可能会改变这一局面,超图也可能成为一个日益强大的建模框架。然而,目前,在缺乏明确且一致的数学优势的情况下,网络(包括多层网络)通常为许多应用提供了一个更实用的框架。

然而,从严格的经验角度来看,数学上的易处理性并非首要考虑因素。由于具有更大的结构特异性,超图模型可能为以参与对称、互反相互作用的节点重叠群为特征的系统提供更简约的表示。因此,图描述与超图描述之间的选择本质上是经验性的且依赖于上下文,并且最终应由关于哪种表示能最有效地捕捉系统相关结构的证据来指导。

尽管如此,关于超图模型的普遍性和一般适用性的主张,往往由我们认为不构成有意义经验证据的论点所支持。这些论点通常采取以下形式之一:

  1. 使用超图表述的网络行为玩具模型的存在。
  2. 将二分网络数据重新解释为超图数据。
  3. 从图数据中推算超图。
  4. 从时间序列数据中对超图进行启发式推断。

我们强调,我们要讨论的并非多元相互作用的经验证据(这方面的证据是实质性的 [54, 87, 88, 109]),而是它们与超图结构的具体联系。

在下文中,我们将依次考察每一类所谓的证据。最后,我们将对超图表述普遍缺乏证据这一现象给出一个一般性的解释。

A. 玩具模型并非证据

关于超图在自然界中据称普遍存在的主张,常以针对特定现象提出的玩具模型的存在作为理由[1–4, 6–8]。例子包括同步模型[19]、种群动力学模型[20–23]、流行病传播模型[25]以及平衡态自旋系统模型[26, 27]等。

在此类情况下,研究者构建并分析了理想化模型以重现特定行为,但并未为其适用性提供经验依据。通常,选择超图表述是出于主观概念上的吸引力,而非基于底层系统确实表现出此类特定多元相互作用的直接证据。即使暂且不论前文已讨论的事实——即每个此类模型都代表了更一般的基于图的表述的特例,且相同的定性行为通常可通过适当结构的基于图的相互作用(例如局部树状或多层图)来重现——这些模型的存在本身也不能替代经验证据。

更根本的是,在超图模型中定性重现宏观现象,并不能确立超图结构对所讨论系统的必要性,甚至无法确立其相关性。若缺乏独立的直接证据表明基于超图的相互作用发挥了特定作用,此类模型仍是欠定的,因为多种非等价的微观描述均可能引发相同的宏观观测行为。在此背景下,引入超图容易混淆多元函数的作用与网络结构的作用,尤其是在未进行系统的模型选择、证伪或与替代性基于图模型进行比较的情况下。

因此,仅因文献中出现了许多使用超图的玩具模型,便合理地声称超图对模拟自然界是“无处不在的”或“必不可少的”,是站不住脚的。充其量,这些模型仅表明超图是一种可能的建模选择;它们并未证明超图在经验上是合理的、能提供独特信息的,或是捕捉所研究现象所必需的。

B. 二分网络重新构想

此类主张包含将传统上作为二分图分析的数据重新解释为超图。此类主张通常分为两类:解释性替代方案和建模性替代方案。

解释性主张在合著者网络中得到了很好的体现 [7, 110],其中连接作者和论文的二分图被重新构想为超图,每篇论文变为一个超边,代表作者间抽象的“相互作用”。³ 类似的重新解释也应用于时空邻近性数据,其中出现在同一时间窗口内的节点被分组到一个超边中 [7, 111, 112]。由于二分图和超图在数学上是等价的对象,⁴ 这种做法通常等同于一种标签替换操作。例如,度分布被替换为超边阶次分布,在不同术语下产生数学上完全相同的描述 [7]。

由于这些“相互作用”未被明确指定,将作者建模为论文之间的“相互作用”似乎同样有效——然而这一替代方案从未被采用。 ⁴ 我们顺便指出,所有服务于 HON 文献的近期超图软件包在内部均依赖于二分邻接列表 [113–115]。由于这些数据结构与一般基于图的框架中采用的数据结构完全相同,此类软件并未提供内在的表示优势,其作用仅限于提供一套定制化算法,而这些算法同样可以在更一般的框架中实现。

尽管超图语言偶尔能突出显示使用二分表示时较少讨论的概念 [110],但这种区别最终是术语上的而非经验性的。暂且不谈将论文表示为单一整体、不可分割的“相互作用”[7] 的认识论价值有限(而非将其视为复杂、内部结构化过程的产物⁵),并对时空邻近性数据作类似考量,仅替换术语并未为超图表述的适用性提供实质性证据。

⁵ 大型论文合作与联盟——通常涉及数十、数百甚至数千名作者——几乎总是被划分为子团队。这种结构不仅经常在论文文本本身中显而易见,也在机构隶属关系和部门细分等元数据中有所体现。这些子团队可能拥有其内部正式与非正式的子结构,并嵌入于稀疏相互作用的整体模式中,其中大量合著者之间并未进行过有意义的互动,甚至可能从未见过面。即使在小型合作中,任务与精力的分配也极少是均匀的,且个体作者的贡献通常具有异质性。因此,明确考虑此类内部结构的模型 [116] 似乎比如文献 [7] 所倡导的不可分割、无结构的群体相互作用模型要合理得多。

第二类子类包含旨在利用超图参数化从二分数据中提取结构的生成模型与算法。一个突出的例子是社区发现,其中超图表述被用于对图数据 [117] 或二分网络单一模态内的节点进行聚类 [102, 118, 119]。这一研究方向原则上是完全合理的:如前所述,超图模型在特定情况下可能产生更简约的描述。

然而在实践中,许多此类方法依赖于未揭示统计证据的启发式描述 [117, 120–122],因此无法与基于图的替代方案进行有意义的比较 [35, 123]。较小的一部分研究代表了向基于显式生成模型的推断方法迈出的早期步骤 [102, 118, 119]。然而,这些研究极少或未提供与图的替代模型 [124] 或二分网络模型 [125–127] 的系统比较,也未采用诸如贝叶斯非参数推断或最小描述长度原则 [123, 128] 等稳健的模型选择技术。

就目前而言,尚无实质性经验证据表明,与不采用超图表述的模型相比,这些基于超图的模型能为二分网络数据提供更优越的描述。

C. 从图数据推算超图

第三类经验分析涉及从图数据中提取超图结构,将观测到的图视为底层潜在超图的投影 [7, 110]。原则上,此问题可表述为统计推断任务,并利用显式生成模型与原则性推断方法加以解决 [102, 118]。然而在实践中,更常见的处理方式是启发式的:直接将图中的团解释为超边 [19, 24, 110, 117]。

除却统计显著性的明显问题(即稠密子图和团可能纯粹由随机波动或低阶相关性产生)之外,这种启发式识别还存在更深层次的概念局限。首先,逆问题在本质上是不可识别的:许多不同的超图构型均可生成相同的投影图,即使在限制性假设下亦然 [129]。若无明确指定的生成模型与显式的模型选择标准,便没有原则性依据来偏好某一推断出的超图而非另一,致使提取出的超图结构在很大程度上是任意的。

其次,更根本的是,这种方法削弱了任何关于超图表示能够捕捉所谓不可约高阶相互作用的主张。如果超边被精确定义为观测图中的最大团,那么任何相关的高阶结构在构建上都可约化为边的叠加。在此设定下,超图并未揭示超越图中已编码模式的任何规律;它们仅仅以超图语言重新包装了图论特征。

基于上述考量,我们认为,基于团从图中提取超图结构,既未确立超图表示的经验必要性,也未提供超越常规图模型所能解释的组织原则的证据。

D. 从时间序列进行启发式推断

最后,最后一类主张涉及从时间序列等间接数据中推断超图模型[130–137]。该类别中的一些研究开发了针对特定超图模型的算法[130, 131, 133, 135, 138],假设数据由该模型生成且被完美测量。由于真实的经验数据通常具有噪声、不完整,且由部分未知的机制产生,此类理想化假设限制了这些方法在实际推断场景中的适用性,并降低了它们对模型误设的鲁棒性。此外,这些方法通常不涉及模型选择——即超图模型是否能对经验数据提供更简约的描述——因此隐式地假设了超图表示的正确性,而非将其与替代方案进行检验对比。若无显式的模型比较,仅靠重构无法确立超图参数化所增加的复杂性是否在经验上是合理的。此外,这些研究中有许多纯属理论性质,并未应用于真实数据集[130, 131, 135]。

其他分析则从时间序列相关性中推断超图结构[132, 134, 136, 139–146]。此类基于相关性的方法在区分直接与间接相互作用方面以不可靠著称,常常产生诸如人为偏高的三角形计数或虚假社区结构等失真现象[35]。这一局限性在高阶设定中尤为严重,其中间接的成对相关性可能伪装成真正的多体相互作用,并导致对多元关系的系统性高估。加剧这一问题的是,许多此类方法并未区分超图参数化与更一般的多元相互作用,从而进一步限制了从中可得出的结论。关键在于,这些方法并未在遵循统计学原则的框架内纳入经验证据——该框架需包含显式的似然模型、复杂度惩罚项以及竞争假设间的正式比较——因此无法解决模型选择问题。综合来看,这些局限性阻碍了现有重构方法确立超图结构是否真正得到经验数据的支持,而非仅仅是建模假设的产物。迄今为止,尚未开发出(或已成功应用于经验数据的)能够恰当考虑模型复杂度[35, 147, 148]并证明超图参数化能为特定系统产生更合理表示的重构方法。

E. 缺乏证据并非偶然

高阶网络(HON)文献中已注意到超图模型缺乏经验支持[4, 149]。我们认为,这种证据的缺失并非偶然:它反映了一个更深层的认识论问题。简言之,不存在任何只能表示为超图而不能表示为图的相互作用系统;因此,试图识别此类系统的尝试很可能是徒劳的。这些网络模型之间的差异源于支配相互作用的具体规则,而非系统的普遍结构属性。

网络数据通常是不完整的,且测量的准确性各异[150]。然而,此处的核心问题超越了这一点:支配相互作用的底层规则几乎总是潜在的。例如,蛋白质-蛋白质相互作用数据库通常仅表明相互作用被认为是正向还是负向;报告学生间友谊关系的调查并未说明流言或感染将如何传播;而神经元图谱也未揭示神经元的放电动力学。这一模式几乎适用于所有网络数据。

由于基于图与基于超图的模型(或任何其他参数化方法)之间的区别取决于这些潜在规则,因此可能永远不存在直接支持一种表示优于另一种的证据。这在科学中是标准做法:模型并非被直接验证,而是通过比较进行评估,最合适的表示将依据简约性、预测性能和解释力而胜出[35]。

VII 多元相互作用的可还原性

正如我们所证明的,近期关于高阶网络(HON)的文献将多元相互作用的存在与超图混为一谈,尽管它们是完全可分离的概念。此外,多元相互作用的“不可还原性”这一概念常被提及[1–4, 6–8],以此作为论证超图合理性的手段,但从未得到详细阐述。在此我们认为,这一概念远比HON文献所承认的更为微妙复杂。

表面上这或许看似一种简化,但表象往往具有欺骗性,因为这些标量函数尽管是一维的,却可能存在大范围的不连续性且任意复杂。尽管存在其他更精巧的替代方法(如科尔莫戈罗夫-阿诺德表示[152–154])能在保持同等普适性的同时使用连续的单变量函数,但在一般情况下,这些函数依然会是复杂的。我们并不主张此类单变量表示具有普遍适用性(我们认为这不太可能),但它们值得提及的原因如下:

  1. 多元函数的“不可还原性”不应被视为理所当然。
  2. 对于某些特例,类似式71的分解可能是简单且实用的。
  3. 仅凭类似式71的形式存在,并不能用于判定某种相互作用属于“低”阶或“高”阶,亦或“可还原”与“不可还原”。
  4. 单变量表示在统计推断中可能颇具价值,因为只需对各个单变量函数进行参数化即可。

事实上,最后一点已在机器学习领域得到应用[155],并且在相互作用函数的具体形式事先未知的情况下,对网络重构方法也可能具有潜在价值。

VIII、结论

我们提供了概念、数学和历史证据,驳斥了近期高阶网络(HON)文献[1–4, 6–8]中突出的一种观点,即超图模型在描述多元相互作用方面取代了基于图的表示。具体而言,我们表明图并不仅仅编码“成对相互作用”。相反,图规定的是节点与谁相互作用,而非这些相互作用如何实现。图的参数化使相互作用函数本身不受约束,网络科学文献早已探索了此类函数的广泛范围,其中许多需要多个邻居之间的协调与合作,因此不能合理地归类为成对的。

基于同样的逻辑,超图所谓的普适性是毫无根据的:超图参数化只能对相互作用的指定方式施加额外约束,因此构成了更一般的基于图的表述的严格特例。因此,基于图的表述不应被普遍视为超图的“简化”,超图也不应被视为网络的“扩展”;在这两种情况下,事实通常恰恰相反。

这一观察结果对网络建模与分析的多个方面具有重要意义,尤其是对从时间序列和其他间接数据中进行网络重构[35, 147, 148]。与其开发显式但定义不清的超图“推广”,不如放宽对潜在节点函数的约束,因为这种方法已经具有最大的一般性。

此外,我们证明,据称唯一可归因于超图参数化的核心现象学主张,往往依赖于实际上无视超图结构本身的计算。因此,这些分析产生的结果与从缺乏团(更不用说真正的超边)的局部类树图模型中获得的结果完全相同。所报告的行为因此属于先前已确立的涌现现象类别(如协同动力学中的突变),而非构成真正的新类别。

基于这些观察,研究人员不应在误解下继续进行研究,即认为超图对于研究复杂系统是必要的,甚至具有普遍实用性。更具体地说,将多元相互作用与超图表述混为一谈,会在理论和方法的开发中引入重大偏差,因为这些开发是在这些概念不可分割的默许但错误的假设下进行的。

历史上,网络科学经历过多次推广浪潮,旨在发展更现实的理论。值得注意的是,人们已投入大量精力去理解随时间演化的网络[156]和由多个相互作用层组成的网络[31]。当前的HON文献似乎是以这些发展为基础构建的。然而,它在关键方面有所不同:网络系统的动态性和多层性在经验上是无可争议的。网络是否随时间变化,或多种相互作用模式是否重要(例如,疾病是通过地面还是空中交通传播对其动力学有深远影响),这些都是无可争议的。

对于所谓的“高阶网络”,情况则根本不同。在此,其动机建立在一个脱离历史的稻草人论据之上——即网络只能表示成对相互作用——以及一个毫无根据的假设,即超图参数化扩展了可能相互作用的空间,而事实上它们收缩了该空间。正如我们所论证的,因此,支持关于超图效应具有最大普适性和普遍性的极端主张的经验证据仍然极其匮乏,这也就不足为奇了。

我们强调,我们并非主张超图参数化无趣或没有价值。相反,它们已被证明是有用的,例如在统计物理学[9]、拓扑数据分析[157]和信号处理[158]中。此外,超图在网络科学中历史上一直未被充分研究,仅凭这一点,对它们重新产生兴趣就是完全合理的。我们反对的是关于其范围和必要性的无根据主张,以及对使用它们所获结果的不准确描述。

我们还强调,对真正的高阶相互作用的研究——例如一个物种的种群数量依赖于两个或多个其他物种的非线性组合、基因调控依赖于启动子或抑制剂的层级结构、催化剂对两种反应物之间化学反应的调节,或动力系统对其历史的依赖性[159]等——是一项极其重要的工作。这一研究路线可追溯至该领域的起源,并非我们批评的目标。相反,我们的批评针对的是近期文献中持续存在的一种混淆,即将此类多元相互作用与超图模型等同起来。正如我们所展示的,这两个概念是完全可分离的。认识到这一区别有助于澄清建模范式,并为利用基于图和基于超图方法的优势互补来研究多元相互作用打开了大门。

原文链接:https://arxiv.org/pdf/2602.16937

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档