关注地球与人工智能,设置EarthAi星标

https://arxiv.org/abs/2602.09030

Figure 1. The UniPhy Architecture
UniPhy提出了一种突破性的连续时间气象基础模型架构,通过三大核心创新解决了现有数据驱动天气模型的根本局限:黎曼-克利福德规范变换实现了地球流形的等距展平,克服了球面几何异质性;非厄米双正交谱算子捕捉了大气非正规动力学中的瞬态能量增长;全局通量追踪器结合并行前缀扫描算法,在O(log T)复杂度下建模开放系统的长期记忆与能量交换。该框架在ERA5数据上验证了零样本时间超分辨率能力,为下一代分辨率无关、物理一致的天气预报奠定了理论基础。
近年来,以盘古、GraphCast、FengWu为代表的数据驱动全球天气预报模型取得了令人瞩目的进展,在确定性预报精度上已媲美甚至超越传统数值模式。然而,这些模型在物理本质上存在结构性缺陷:
第一,离散时间映射的刚性约束。 主流大模型将大气演化简化为固定时间步长(如6小时)的离散映射,这违背了物理定律固有的时间分辨率无关性。这种刚性离散化限制了模型在零样本时间超分辨率(zero-shot temporal super-resolution)和连续时间数据同化中的应用能力。
第二,封闭系统假设的偏离。 现有框架通常隐含封闭系统或马尔可夫过程假设,即动力学仅依赖于瞬时状态。然而真实大气是由太阳辐射、海-气热交换等持续能量通量驱动的耗散开放系统,且具有ENSO、MJO等长期遥相关记忆。忽视这种历史依赖性能量交换会导致预报轨迹逐渐偏离真实物理吸引子。
第三,几何异质性的表征困境。 标准模型将大气状态视为平坦欧几里得张量,忽略了地球流形的内在曲率。直接应用全局谱方法(如球谐函数)处理局部地形效应时会产生吉布斯现象,而自适应时间步长会破坏FFT加速所需的托普利茨结构,迫使模型采用计算昂贵的串行执行。
为克服离散建模局限,研究者转向神经微分方程(Neural ODEs)和哈密顿神经网络等连续时间框架。虽然这些方法恢复了时间连续性,但它们通常隐含数学正规性假设——即系统的动力模态被假设为正交或辛结构。真实大气流体是典型的非厄米系统(non-Hermitian systems):在切变流或斜压不稳定过程中,非正交模态间的干涉会导致严重的瞬态能量增长(transient energy growth),即使系统渐近稳定。传统守恒型或正规神经算子在数学上无法描述这种非模态湍流启动机制。
针对几何、热力学、全局记忆三重挑战,本文提出UniPhy(Unified Physics)——一种连续时间非厄米神经随机偏微分方程(SPDE)求解器。其核心目标是建立一个物理完备的基础模型架构,统一几何适应性、热力学一致性与计算效率。
UniPhy的架构由四个耦合模块组成(图1):黎曼-克利福德编码器、自适应时间输入、半群算子生成器(连续时间物理引擎)、以及并行前缀扫描积分引擎。
核心问题: 标准卷积神经网络忽略地球表面的内在曲率,导致极地区域严重的谱混叠和非物理畸变(极问题)。
解决方案: 作者提出将大气状态表示为 residing in Clifford代数 的多矢量场。该代数结构自然区分几何等级:标量(热力学变量)、矢量(风速)、双向量(涡度与旋转)。
编码器 充当可学习的规范场(gauge field),通过局部坐标展平变换补偿局部曲率。Clifford卷积定义为等级特定操作:
其中度量修正因子 由黎曼度量张量的行列式解析导出。通过对输入特征进行该因子调制,网络有效执行局部坐标展平,使潜在表示 与流形的切丛等距。附录A.2中的定理1严格证明了当可学习参数 收敛到共形因子 时,该变换构成等距映射。
物理意义: 这种几何解耦策略使得后续动力学层能够在平坦潜在空间中执行高效欧几里得运算,同时不违反球面上的角动量和质量守恒定律。
核心问题: 标准谱模型基于傅里叶理论,使用具有正交特征基的正规算子(Normal Operators)。根据谱定理,这类系统的能量增长严格受谱实部限制,无法捕捉大气不稳定中固有的爆发性能量突增。
解决方案: 引入双正交谱传播器(Biorthogonal Spectral Propagator),使用满足 的双正交基对 和 构造演化算子:
这种因式分解创建了一个非正规算子(non-normal operator),其特征向量非正交。非正交性允许状态矢量旋转到算子范数暂时超过1的子空间,从而模拟斜压不稳定中典型的剪切驱动能量转移过程。
稳定性机制: 为进一步稳定学习过程,变换基 实现为残差插值:
固定离散傅里叶变换基 提供表示稳定罗斯贝波传播的物理先验,而可学习门控标量 动态调节从保守物理先验到复杂非正规动力学的过渡。
附录A.3中的命题1证明:对于非正规算子,即使谱横坐标 (渐近稳定),数值横坐标 仍可能大于0,从而允许瞬态能量增长。图3显示,UniPhy学习的算子在初始阶段(t<12小时)呈现超过9.0倍的能量放大,这是非正规流体不稳定性的数学特征。
核心问题: 大气可预测性跨越多个时间尺度——快速发展的天气尺度(3-5天)与缓慢的季节内振荡(20-60天,如MJO、ENSO)。无记忆算子仅依赖瞬时状态,无法表征这种热力学惯性。
解决方案: 引入全局通量追踪器(Global Flux Tracker)作为专用记忆子系统。与编码局部变化的空间解析潜在状态 不同,通量状态 表示积分的全球环流指数。
通过在全球特征谱上执行全局均值池化提取行星波数和全球能量预算:
通量状态按连续时间衰减-强迫方程演化:
复衰减率 决定不同记忆模式的持续性。积累的通量状态通过门控强迫机制调制系统动力学:
动态门 使系统能够选择性放大持续强迫信号,同时滤除瞬态噪声。图4显示,学习的记忆时间尺度呈现明显层次结构:97.5%的模态集中于5天以内的短期天气动力学,而关键的1.6%模态捕捉超过20天的长期遥相关。
核心问题: 传统数值求解器强制严格串行因果性——时间 的状态必须在 之前计算。这种串行依赖阻碍现代并行计算硬件的利用,并限制模型从长期历史中学习的能力。
解决方案: 利用算子半群的代数结合性,将时间演化重构为仿射变换的代数问题。从步骤 到 的离散过渡构成仿射变换 。
定义二元组合算子 作用于仿射变换的元组空间:
该算子满足结合律(附录A.5定理2),揭示时间维度中隐藏的并行性。利用这一性质,使用并行前缀扫描算法(Parallel Prefix Scan)替代串行循环:
附录A.6定理3证明,该算法将理论关键路径复杂度从线性时间 降至对数时间 。这使得UniPhy能够在单次并行传递中处理跨越数千时间步的序列,有效折叠时间维度,避免梯度消失或爆炸问题。
训练连续时间随机算子处理混沌系统需要平衡短期精度与长期稳定性。作者提出双阶段课程学习策略:
将相邻时间戳之间的过渡视为单步积分问题,学习局部切线动力学和几何规范变换。优化复合损失函数:
其中 表示按纬度余弦加权的 范数(考虑球面面积元),CRPS(连续分级概率评分)校准可学习扩散率 以匹配子网格尺度的固有不确定性。
通过多尺度时间积分方案实施微调以强制全局物理一致性。从均匀分布 动态采样推出范围 ,将目标区间 细分为 个更小的子步。优化自回归梯度流目标:
该过程通过时间反向传播损失信号,显式训练模型纠正自身累积误差。递归反馈回路迫使全局通量追踪器学习稳定动力学,作为对抗非物理漂移的恢复力。
使用ERA5再分析数据集2000-2009年连续时段,保留原生0.25°高分辨率网格(721×1440),选取30个关键大气变量(包括位势高度、温度、风场、相对湿度等,覆盖925-100 hPa及地表变量)。
通过可视化学习的位置嵌入(图2),发现其空间分布呈现预期的纬向带状结构,并自发涌现出地理感知:热图清晰勾勒出大陆海岸线和青藏高原、澳大利亚大陆等高海拔区域的独特高激活模式。定量分析显示,学习权重与解析逆度量因子 的皮尔逊相关系数达 ,证实模型为极地地区分配更高权重以执行度量补偿。
对训练块进行雅可比线性化提取有效演化算子 。谱分析(图3)显示:
在未见过的细粒度时间步()上测试12小时累积预报RMSE。微调模型在 时达到0.0738的RMSE,比预训练模型(0.0833)提升约11%。可视化显示(图5),在 时,预训练模型出现结构退化,而对齐微调模型生成与实况高度一致的物理一致轨迹,证明模型成功参数化了底层连续时间微分方程,而非仅记忆离散映射。
UniPhy代表了一种物理完备的基础模型架构,通过统一黎曼-克利福德几何、非厄米双正交动力学和全局记忆机制,克服了现有数据驱动天气模型的根本局限。其核心贡献在于:
局限性与未来方向:
通过超越离散架构的刚性时间步限制,UniPhy为下一代分辨率无关且物理一致的全球天气预报建立了数学稳健的框架,标志着从"数据拟合"向"物理学习"的范式转变。

Figure 2. Mechanistic Verification of Geometric Perception.

Figure 3. Evidence of Non-Normal Amplification.

Figure 4. Emergence of Memory Hierarchy.

Figure 5. Qualitative Comparison of Zero-Shot Temporal Generalization on Mean Sea Level Pressure
以上是对文章的详细解读,如有不当之处欢迎批评指出!
END
声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理