首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >《Science Advances》| 物理一致的隐空间资料同化方法

《Science Advances》| 物理一致的隐空间资料同化方法

作者头像
气象学家
发布2026-03-26 11:13:30
发布2026-03-26 11:13:30
760
举报
文章被收录于专栏:气象学家气象学家

Science Advances | 物理一致的隐空间资料同化方法

https://www.science.org/doi/full/10.1126/sciadv.aea4248

一、研究背景

1.1 什么是资料同化?

资料同化(DA)旨在融合观测与 模式预报(背景场)等多源信息,以估计动力系统的最优状态。在大气科学中,它既用于为数值天气预报提供高质量初值,也用于生成再分析数据集,对天气预报与气候研究都具有重要意义。

1.2 为什么物理一致性对资料同化重要?

如果同化得到的“分析场”缺乏物理一致性,往往会触发不平衡调整,降低后续预报的稳定性与可预报性;同时也会削弱再分析数据在气候诊断与归因研究中的可信度。

1.3 传统资料同化算法如何保证物理一致性,有什么局限性?

  • 传统贝叶斯同化(如 4DVar、EnKF)通常通过背景误差协方差矩阵B来表征变量之间的物理关联,从而约束分析增量并提升一致性。
  • B 的可靠估计非常困难:维度极高,且误差统计随天气形势不断变化(流依赖)。因此在实践中往往不得不依赖大量经验性简化与调参,这也成为进一步提升同化性能的关键瓶颈。

1.4 AI同化算法做的怎么样?

近几年 AI 资料同化逐渐兴起,大致有三条路线:

  • 给传统同化打“补丁”: 例如改进观测质量、降低计算开销、或对分析结果做后处理。由于同化框架本身不变,整体性能上仍较难突破由 B 矩阵建模带来的限制。
  • 生成式/扩散式同化(diffusion-based):以扩散模型为核心,用观测来引导生成过程,把观测信息逐步“纠正”进结果里。但该方案观测与先验的融合多依赖启发式设计,且难以显式考虑背景场与观测不确定性与模式动力学约束,性能有限。
  • 端到端同化(end-to-end): 把再分析资料(通常是ERA5)当“标签”,直接学习从观测+背景到分析场的映射,具有非常好的分析性能,但往往难以像传统贝叶斯同化那样系统地融入各种先验信息(不同误差来源、动力学约束等),而物理约束也常是“隐式学到”,可控性与可解释性不足。

二、隐空间资料同化方法

2.1 方法简介

隐空间资料同化(Latent Data Assimilation, LDA)的基本流程是:先用自编码器(Autoencoder)的编码器(Encoder)将高维背景场编码为隐变量 zb,再集合观测 y 在隐空间中进行变分同化得到隐空间分析 za,最后通过解码器(Decoder)将 za 还原为模式空间分析场 xa。

2.2 隐空间下的背景误差协方差矩阵

尽管隐空间维度显著降低,但若使用满秩的隐空间背景误差协方差矩阵 Bz,其规模仍可达109量级,工程上难以求解。但在实践中发现,在物理空间复杂的协方差关系在隐空间消失了,Bz 天然近似对角,因此可以用对角近似。这显著降低了隐空间同化的工程实现难度。

2.3 实现细节

 数据集:采用 1.41∘ 分辨率的 ERA5 再分析数据集。

 观测:使用 GDAS 常规观测,包括地面观测与探空观测。

 预报模型:采用上海人工智能实验室开发的 FengWu 的低分辨率简化版本。

 自编码器(AE):采用基于 Swin-Transformer 的结构。

 同化算法:在隐空间分别实现三维变分与四维变分,同化方案记 L3DVar L4DVar。其中 L4DVar 需要预报模型(FengWu)在同化窗内提供动力传播。代价函数在 PyTorch 框架下用自动微分直接优化,求解过程不需要构造伴随模型。

 背景误差协方差 Bz: NMC方案。

三、LDA同化效果

理想观测同化-预报试验(图A)

平均来看,L4DVar 相对 4DVar 的分析误差再降 5.1%,并且在多数变量上能把优势维持到后续预报期。

L3DVar 相对 3DVar 也有提升(约 3%),但不如 L4DVar ,说明“把模型动力学纳入隐空间同化”非常关键。

真实观测同化-预报试验(图B)

在 GDAS 常规观测下,4DVar 与 L4DVar 都能提升预报技能,且 L4DVar 在几乎所有变量上更优。

预报最初时段 L4DVar 与 4DVar 表现接近,随后 L4DVar 优势更明显。这可能是因为4DVar 分析场可能含有小尺度噪声,短期验证指标“虚高”,也即 “assimilation shock”

真实观测循环同化试验(图C) - 在 2017 年循环同化中,用未同化观测验证分析场:69 个变量中有 54 个变量,L4DVar 分析更准;平均误差降低约 5%。

用预报场训练AE会怎么样(图D)?

我们将 AE 的训练数据从 ERA5 再分析改为 FengWu 的 5 天预报场,并在此基础上测试 L4DVar(记为 L4DVar-FC)的性能:

尽管预报场误差更大,L4DVar-FC 的循环同化分析质量与用 ERA5 训练 AE 的结果 接近,并且仍然优于传统 4DVar。

同化后的分析误差还可以低于训练预报场本身的平均误差(图中虚线),说明 LDA 具有超越其训练数据精度的潜力。

四、LDA的物理一致性

4.1 单点同化试验:

在 L3DVar 中使用静态、对角的 Bz ,仅对 500 hPa 位势高度(Z500)施加一个单点扰动(+200m2/s2),分别将扰动中心放在中国(北半球)与澳大利亚(南半球)。背景场取 2017-12-01 00 UTC 的 ERA5。图中给出位势高度与风场的分析增量(第一行),以及温度增量与背景风场(第二行)。

位势高度增量从扰动中心向外衰减,并诱发明显的反气旋式风场增量。

更关键的是,风场响应在南北半球方向相反,符合与 500 hPa 上的地转平衡。

对应的温度增量沿背景风场分布,呈现与背景流型一致的结构特征。

在相同的观测增量下,不同背景案例得到的分析增量存在差。

这些结果表明:LDA具有内在的物理一致性与流依赖特性

4.2 LDA为什么具有内在物理一致性?

通过测试不同物理量对隐空间变量的响应(图A),我们发现:

不同隐空间变量总是稳定地编码特定物理量的组合。

不同隐空间变量表征的信息近乎正交(请见原文补充材料Fig. S6)

敏感性测试表明(图B):

耦合性强的变量(Z500)在被平滑后仍能被 AE 恢复出绝大部分信息

耦合性弱的变量(Q500)被平滑后则很难被AE恢复。

以上结果说明 隐空间已经直接捕捉了变量间的依赖关系, 因此LDA不必依赖一个结构化的 Bz 来“强行”施加物理约束。

五、为什么可以在隐空间同化?

如何确保在不可解释的隐空间获得的最优分析,经过非线性解码器后仍对应模式空间的最优解?

本研究发现,在同化更新所涉及的局部邻域内,AE 的解码器呈现近似“局部仿射”特性(即一阶泰勒展开在该范围内成立)。在这一条件下可以证明,隐空间变分同化与模式空间变分同化得到的分析解是近似一致的。

直观来说,在解码器为线性(仿射)映射时,隐空间代价函数继承了模式空间代价函数的凸性,从而保证二者解的一致性

六、隐空间大小该如何选取?

本文对比了不同隐空间压缩率下 LDA 的表现及 AE 的重构误差,发现:

LDA 在较宽的压缩范围内都优于模式空间同化,其中 L4DVar 对隐空间大小更不敏感。

随着压缩率升高,AE 的重构误差增大。

LDA 性能随压缩增强呈现“先升后降”,最优压缩率在不同试验设置下都稳定在32 倍。

研究发现,这种“先升后降”的趋势可以由一个trade-off解释:压缩增强会促进隐变量去相关,使 Bz 更接近对角、同化更有效;但压缩过强会带来更大的重构误差并丢失关键信息,反而削弱同化效果。

进一步地,Bz 的对角性会随压缩率上升逐渐趋于饱和,而重构误差则持续增大,因此最优隐空间大小是客观存在的,可通过对不同压缩率的对比实验搜索获得。

七、本文局限性与未来方向

AE 重构误差与表征能力:LDA 的效果会受到 AE 重构误差的限制,因此需要更强的 AE 设计;同时隐空间可能难以充分表征极端结构,未来可与其他资料同化或 AI 方法结合,以提升对极端天气的同化能力。

误差建模仍偏理想化:目前隐空间背景误差仍采用高斯假设,且缺乏系统的不确定性估计;未来需要探索集合式或更非线性的 LDA 形式来改进。

L4DVar 的适用性:现阶段 L4DVar 依赖可微分预报模型,因此主要适用于 AI 预报系统;L4DVar 与传统数值预报模式的结合方式仍需进一步探索。

非常规观测的推广:本文主要验证了常规观测条件下的效果;在卫星辐射、雷达等非常规观测及其更复杂的观测算子与误差特性下,LDA/L4DVar 的适用性与增益仍需进一步评估。

本研究由上海人工智能实验室、美国哥伦比亚大学、南京信息工程大学和香港中文大学联合完成。第一/通讯单位为上海人工智能实验室。通讯作者为上海人工智能实验室青年科学家白磊、香港中文大学博士后费奔,以及南京信息工程大学教授刘玉宝。第一作者樊航曾为上海人工智能实验室实习生,现为哥伦比亚大学博士后。如有相关问题,欢迎联系:hf2526@columbia.edu

END

声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 气象学家 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档