近日,依随DeepSeek的爆火,人们对大语言模型和思维链热情高涨。在DeepSeek的交流中,人们在惊叹其知识渊博、才思敏捷的同时,也不停地为其幻觉所纷扰。尤其当人们探询涉及现代数学的问题时,大模型所提供的答案缺乏应有的严密性和见解的思想深度。目前,语言大模型依然基于概率模型,即大模型从人类的语言交流中学习了定义在词牌(token)序列所构成的空间中的概率分布,从而可以通过上下文推导出下一个词牌或者词牌序列的概率。思维链也被视为词牌序列,提高了大模型的深度推理的精确性。
从某种意义上而言,这非常类似代数中的基本观点:代数群或者域中的每个元素,由它与其他元素之间的关系所唯一决定。也类似马克思对人的观点:“人是所有社会关系的总和”。当大模型得到每个词牌(或者词牌序列)与其他词牌序列之间的概率关系,基本上就觉得了这个词牌序列。这个观点用在不同语言之间的翻译上,非常自然和奏效。但是这个观点对于现代数学而言,非常值得深入探究。
现代数学中的每个概念和定理都有着深刻的内在含义,其应用的严格程度远远超过自然语言。文学中的遣词造句往往是类似词牌之间的排列组合,数学语言中精确的顺序不容打乱,相似概念也无法混淆。基于概率的语言模型力有不逮。目前大模型可以学习思维链,即常见的解题套路,因此对于常见的数学习题可以轻易求解。但是数学理论发展过程中,核心就是发展新方法,提炼新概念,甚至是新的数学语言。因此前沿数学在未成形时,往往缺乏充分的训练语料。因此,目前的大语言模型在数学推理方面与人类的期望尚有差距。
笔者近日科研需要用到黎曼Theta函数的理论,与大语言模型深入探讨之后,依然觉得所得回答过于空泛,虽然自圆其说,但是依然觉得宛如隔靴搔痒,无法透彻领悟。黎曼Theta函数理论自成一体,深邃优美,同时给出几何偏微分方程的另外一种偏代数解法,直截了当,简洁有力。笔者于是抛砖引玉,浅谈理论的梗概,与广大读者共同探讨。
曲面上的亚纯函数
物理世界中的所有实体都嵌入在三维欧式空间
中,实体的表面都是二维曲面,将
分割成物体内部和外部,从而曲面是可定向的。同时,实体表面带有欧式度量诱导的黎曼度量
。由此,物理世界中的曲面都是带度量的可定向曲面,记为
。陈省身先生曾经证明了如下的定理:曲面上任取一点
,则存在该点的邻域
和局部坐标
,使得黎曼度量具有简单的表示。这种特殊的坐标被称为是等温坐标(isothermal coordinates)。曲面被局部等温系覆盖,成为黎曼面(Riemann Surface)。曲面上的各种物理场可以表示成为黎曼面上的各种几何实在,例如曲面上的电磁场。
图1. 平面上静电场的复电势。
平面上的静电场可以用所谓的复电势(complex potential)来表示,即复变函数中的亚纯函数来表示。例如给定正电荷的位置
和负电荷的位置
,相应的亚纯函数
表示为:
复电势可以表达为:
这里上述公式就是球面上的有理多项式的因式分解。图1显示了平面上静电场的复电势表示,红色曲线是电力线,蓝色曲线是等势线,电力线与等势线处处垂直,正电荷成为源,负电荷成为汇,电力线从源流向汇。
图2. 黎曼面上的亚纯函数。
曲面可以通过保角变换映射到平面区域,从而将平面的电场拉回到曲面上,形成曲面上的电场。如图2所示,三维人脸曲面通过黎曼映照保角地映射到平面区域。平面上一对正负电荷诱导的静电场拉回到曲面上,得到曲面上的复电势函数,即黎曼面上的亚纯函数。
亚纯函数在黎曼面上的作用举足轻重。一张黎曼面上的所有亚纯函数构成一个代数域(field),两张黎曼面上的亚纯函数域代数同构(algebraic isomorphic),当且仅当两张曲面之间存在保角双射(即共形等价 conformal equivalence)。黎曼面理论中的中心定理,例如阿贝尔-雅可比定理(Abel-Jacobi),黎曼-罗赫定理(Riemann-Roch)都是来描述亚纯函数的整体行为。黎曼面上关键的核心概念,与几何拓扑中的很多领域都有深刻而本质的联系。例如三维流形理论依赖于曲面映射类群理论、Teichmuller理论与曲面叶状结构理论,而这些理论都与特殊的阿贝尔微分紧密相连(即所谓的全纯二次微分);曲面的实射影结构与黎曼面的全纯三次微分等价。阿贝尔微分(Abel differential),及其现代推广,全纯线丛中的亚纯截面层等,核心也都依赖于特定亚纯函数的构造。
黎曼因式分解定理
由数学物理方程理论我们知道,黎曼流形上的各种物理场最终都是由偏微分方程来控制。例如曲面上静电场可以由椭圆型偏微分方程来刻画。在黎曼所处的时代(1826 – 1866),数学中的偏微分方程理论尚处于萌芽状态。直到100多年之后,丘成桐先生才创立几何分析学派,系统性地将偏微分方程理论用于几何。令人极为惊讶的是黎曼在没有偏微分方程理论工具的情形下创立了极为完备丰富的黎曼面理论,其中大量的定理本质上是带有黎曼度量的流形上特定偏微分方程解的存在性定理,现代的讲法都是用偏微分方程理论来阐释这些定理。当然,在黎曼的年代也没有计算机,无法借用微分方程的数值解。那么,黎曼是如何做到不用偏微分方程理论而给出偏微分方程解的呢?答案就在于黎曼Theta函数理论。
借助Theta函数,黎曼将有理多项式的因式分解定理从拓扑球面推广到高亏格曲面,从而得到所谓的黎曼因式分解定理:假设
是黎曼面,亏格大于零,
是亚纯函数,即限制在每一个局部等温坐标系下
是复平面上的亚纯函数,
的零点是
,极点是
,那么
具有因式分解:
这里
是黎曼面上任选的基点,
是一个特定的全纯微分(第一类阿贝尔微分),
是黎曼Theta函数,
是
的一个零点,
。这里的
可以用无限求和的代数方法计算出来,从而避免求解偏微分方程。
图3. 数字扫描的水仙女神雕塑(局部)。
黎曼面的基本概念
图3显示了希腊神话中的水仙女神雕塑(a Nymphe Salmacis, by Francois Joseph Bosio),现藏于摩纳哥国家博物馆。我们用这个亏格为二的曲面来简介相关概念。曲面上的流场可以定义散度,即给定点处的净流入流出量,因此散度可以来标识流场的源和汇;旋量表示给定点处的旋转运动,用于标识流场中的漩涡。如果一个矢量场旋量处处为零,同时散度处处为零,则我们称之为调和场,例如真空中的静电场,满足经典的拉普拉斯方程。考察曲面上光滑无旋切矢量场,我们将其分类,如果两个场相差一个梯度场,则我们称它们彼此上同调等价。所有等价类在加法下成群,即所谓曲面的德拉姆上同调群(deRham cohomology group)。著名的Hodge理论断言:每一个上同调类中,存在唯一的调和场,所有调和场构成的群和德拉姆上同调群同构。图4左帧显示了亏格为二的曲面上调和场,我们画出了调和场的积分曲线,可以被视为曲面上无源静电场的电力线。调和场每一点处围绕法向量旋转90°得到另外一个调和场,即原场的共轭场,共轭场的积分曲线给出了等势线,图4中帧显示了共轭调和场。假设
是一个调和场,
是其共轭,那么
被称为是第一类阿贝尔微分,亦称全纯微分。所有的全纯微分成群,图4右帧显示了曲面上的一个全纯微分。每个全纯微分都有
个零点。
图4. 从左到右,调和微分,共轭调和微分,全纯微分。
假设曲面一维下同调群
的基底为
,
是一个全纯微分,通过积分
我们可以将黎曼面
周期性的(分支)浸入到复平面上,
的零点成为分支点。我们随机选取一个基点
,定义Abel-Jacobi映射
,
这里积分路径任选。假设我们选取两条不同的路径
,连接
和
,
那么沿着不同路径的积分彼此相差整数倍的周期:
图5. 经过零点的测地圈。
图6. Abel-Jacobi映射(左侧环柄)。
图7. Abel-Jacobi映射 (右侧环柄)。
图5-7显示了阿贝尔-雅可比映射的概念。如图5所示,首先全纯微分
具有两个零点
和
,
诱导了一个带奇异点的平直度量
, 经过零点的测地圈为
。我们沿着
切割曲面,得到两个连通分支,每个分支包含一个环柄。如图6、7所示,左侧环柄上的同调群基底为
,右侧环柄上的基底为
。每个环柄被阿贝尔-雅可比映射
周期性地映到平面上,每个周期是一个平行四边形,底边和侧边分别是
的
和
周期,即
,
;同样的,曲面右侧环柄被周期性地映射到复平面上,每个周期是一个平行四边形,其形状由
的
和
周期所刻画。
将测地圈
映射成线段,左右环柄的像沿着这条线段交错粘贴在一起。我们看到只用一个全纯微分我们只能得到浸入映射。
黎曼提出用全纯微分的基底
来计算Abel-Jacobi映射:
不同的积分路径带来的误差落在格点
上,
这里
被称为是
的周期向量:
的像落在复流形
上,
被称为是黎曼面的雅可比簇(Jacobian)。
通常我们选取归一化的全纯微分基底,
,使得
那么
-周期矩阵成为单位矩阵,
-周期矩阵的虚部为对称正定矩阵,
黎曼Theta函数
黎曼Theta函数
定义为
可以证明,在紧集上
一致收敛,
是偶函数
. 更进一步,
具有拟周期性:
这里
是
,
周期矩阵的第
列向量。考察复合映射
它在黎曼面
上有
个零点,表达成一个除子
其在Abel-Jacobi映射下的像为
更为一般的,令
为Jacobian中的任意一点,我们考察复合映射
,那么有两种情形会发生:正常情形和反常情形。在正常情况下,
, 它在黎曼面
上有
个零点,表达成一个除子
其在Abel-Jacobi映射下的像为
这时,除子
的黎曼-罗赫空间
的维数为零,这里
为所有全纯微分
组成的线性空间,
的所有点都是
的零点,
在反常情形下,
,存在
个点
,满足
并且
的维数为零。
如果我们记复流形
这里
是
个字母的排列群,即度为
的有效除子构成的加法群。那么黎曼证明了如下定理: 映射序列
是正合列,即
。
是满射,局部上
的退化程度取决于
的维数,同时
在
的退化程度取决于
的维数,这里
。
图8. 曲面上亚纯函数的对数,函数的零极点成为对数函数的简单极点。
黎曼因式分解定理证明
我们用黎曼-Theta函数来构造亚纯函数。首先给定黎曼面上的任意两点
和
,我们考察微分
首先,
和
分别是右侧Theta分式函数的零点和极点;其次,由拟周期条件,当
沿着
移动回到自身位置时,
变成了
,
函数不变;当
沿着
移动回到自身位置时,
变成了
,Theta分式函数多了个因子
与点
无关。由此
是一个第三类阿贝尔微分,
假设
是黎曼面上一个非常数的亚纯函数,其零极点为
由阿贝尔定理,
为亚纯函数的除子,
,
构造全纯微分
来补偿周期,
如此得到阿贝尔微分
其
-周期为
其
-周期为
因此
是定义在黎曼面
上的亚纯函数,与
具有同样的零极点,因此
如此我们得到了黎曼因式子分解定理。图8、9显示了曲面上不同亚纯函数的零极点分布。
图9. 曲面上的两个亚纯函数的对数。
黎曼面上,带有黎曼度量曲面上的各种几何实在,亚纯函数,全纯微分,阿贝尔微分,全纯线丛的亚纯截影,都依赖于求解特定偏微分方程的分析方法,也都可以用黎曼Theta函数的代数方法来求解,这为几何计算带来很大的便利,同时也揭示了微分方程与共形几何、复几何更为深层次的内在联系。
【老顾谈几何】邀请国内国际著名纯粹数学家,应用数学家,理论物理学家和计算机科学家,讲授现代拓扑和几何的理论,算法和应用。
领取专属 10元无门槛券
私享最新 技术干货