首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI天气模型如何学习预测极端天气?

AI天气模型如何学习预测极端天气?

作者头像
气象学家
发布2026-03-25 19:09:50
发布2026-03-25 19:09:50
1520
举报
文章被收录于专栏:气象学家气象学家

AI天气模型如何学习预测极端天气?

https://arxiv.org/abs/2509.10639
https://arxiv.org/abs/2509.10639

https://arxiv.org/abs/2509.10639

Figure 1 Results for the PNW (a, d, g), Northern European (b, e, h) and Antarctic (c, f, i) Heatwaves.
ERA5 T2M anomaly compared to 1979–2015 climatology (a–c) for the forecast date (Table 1) over
the region of analysis (colored shading).
Figure 1 Results for the PNW (a, d, g), Northern European (b, e, h) and Antarctic (c, f, i) Heatwaves. ERA5 T2M anomaly compared to 1979–2015 climatology (a–c) for the forecast date (Table 1) over the region of analysis (colored shading).

Figure 1 Results for the PNW (a, d, g), Northern European (b, e, h) and Antarctic (c, f, i) Heatwaves. ERA5 T2M anomaly compared to 1979–2015 climatology (a–c) for the forecast date (Table 1) over the region of analysis (colored shading).

一、研究背景与意义

近年来,人工智能(AI)天气模型如Google的GraphCast、华为的Pangu-Weather和NVIDIA的FourCastNet等,在天气预报领域展现出巨大潜力。这些模型基于再分析数据(如ERA5)训练,以均方误差(MSE)或平均绝对误差(MAE)为损失函数,在计算效率、预报速度和平均预报精度方面表现出色。然而,极端天气事件(如热浪、大气河流、热带气旋)的预报仍是其薄弱环节。在气候变暖背景下,极端天气频发,提高其对高影响天气的预报能力具有重要的科学和社会意义。

本研究由科罗拉多州立大学和劳伦斯伯克利国家实验室的研究团队完成,首次系统分析了一个球形傅里叶神经算子(SFNO)模型在90个训练周期中对9个极端天气事件的预报能力演变过程,并提出了改进极端天气预报的训练策略。


二、研究方法概述

2.1 极端事件选择与定义

研究选取了2019、2021和2022年三个年份中9个具有全球影响的极端天气事件,包括:

  • 热浪(Heatwaves):2021年太平洋西北(PNW)热浪、2022年北欧热浪、2022年南极热浪;
  • 大气河流(Atmospheric Rivers, ARs):2019年美国中西部AR、2019年新西兰AR、2022年格陵兰AR;
  • 热带气旋(Tropical Cyclones, TCs):2022年飓风Ian、2019年气旋Idai、2019年飓风Dorian。

每个事件都伴有显著的社会经济影响(详见表1)。

2.2 变量与区域选择

为每个极端事件选择一个关键变量进行分析:

  • • 热浪:2米温度(T2M);
  • • 大气河流:整层水汽总量(TCWV);
  • • 热带气旋:平均海平面气压(MSL)。

并据此划定分析区域,以突出事件的异常特征。

2.3 模型与训练设置

使用球形傅里叶神经算子(SFNO),其架构与FourCastNet v2相同,包含编码器、8个SFNO块和解码器。模型在1979–2015年的ERA5数据上训练,共90个周期,前70周期使用余弦退火学习率(初始1e-3),后20周期进行两步微调(初始1e-4)。每个周期结束后保存模型权重,用于后续分析。

2.4 评估方法

对每个事件和每个参考时间点进行5天(20个时间步)的预报推演,共生成90个预报结果。使用区域加权均方根误差(RMSE)极值绝对误差作为评估指标,并对90个检查点的误差进行高斯平滑处理,以识别趋势而非随机波动。


三、主要研究结果

3.1 热浪预报:与参考日相似,无明显退化

三个热浪事件中,PNW和南极热浪属于“灰天鹅”事件,即训练集中未出现的极端事件。尽管其温度异常显著(PNW达19K,南极达38K),SFNO对其预报误差与参考日相比并无显著差异。模型在训练后期(周期70和89)的表现最佳,且误差始终位于参考日预报的5%~95%分位数范围内。这表明SFNO可能通过区域迁移学习(translocation) 从其他地区的热浪事件中学习,而非依赖同一地区的较弱事件。

3.2 大气河流预报:早期学习后期退化

中西部和新西兰的AR事件在TCWV异常强度上显著高于参考日,而格陵兰AR相对较弱。研究发现:

  • • AR的区域模式(空间分布) 预报误差在训练早期(周期22、40、25)最佳,随后逐渐退化;
  • 极端湿度值的预报在周期70时仍优于参考日平均值,但空间定位能力较差。

这表明模型在早期学到了AR的关键信息,但随着训练进行,这些信息被“平滑”掉,以优化整体平均误差。

3.3 热带气旋预报:整体表现差,早期学习后期严重退化

TC的预报误差显著高于参考日,尤其是在气旋强度(最低MSL)方面,与已有研究一致(如DeMaria et al., 2025)。值得注意的是:

  • • 即使最佳检查点(周期70和89)的误差也远高于参考日的5%~95%分位数;
  • • 训练早期(如周期20-30)的预报明显优于后期,某些情况下后期误差是最佳早期的6倍。

这表明SFNO在训练早期学到了TC的一些特征,但随着训练推进,这些信息丢失,导致预报能力下降。


四、讨论与改进策略

4.1 极端事件学习的特殊性

研究结果表明,AI天气模型在训练过程中并非均匀地学习所有天气类型。对于AR和TC这类具有强烈空间结构和极端值的事件,模型在早期就能捕获关键特征,但随着训练以最小化时间平均误差为目标,这些特征逐渐被平滑掉。这与Bonavita(2024)的观点一致:AI天气模型更适用于优化中范围平均误差,而非极端事件。

4.2 早期停止的局限性

虽然早期检查点在极端事件预报上表现更好,但这些检查点在参考日预报上通常较差。因此,简单地早期停止并不是可行策略,因为它会牺牲整体预报性能。

4.3 指数移动平均(EMA)的潜力

作者提出使用权重指数移动平均(EMA) 来融合不同训练阶段的模型权重,以保留早期学到的极端事件信息。初步实验(以中西部AR和飓风Ian为例)显示:

  • • 使用衰减率0.9的EMA模型在周期50–70之间显著优于原模型;
  • • 极端事件预报误差降低,而参考日预报误差基本保持不变;
  • • 微调阶段(71–90)EMA对极端事件的预报性能下降,但与参考日误差持平。

这表明EMA是一种低成本、高效率的改进策略,能够在保持整体预报性能的同时提升极端事件预报能力。


五、研究贡献与未来方向

5.1 贡献总结
  • • 首次系统追踪了AI天气模型在训练过程中对极端事件预报能力的演变;
  • • 发现AR和TC的预报能力存在“先升后降”的现象,提示当前训练策略存在缺陷;
  • • 提出并初步验证了EMA作为一种有效的改进方法。
5.2 局限性与未来工作
  • • 研究仅基于一个模型(SFNO)和9个事件,结论仍需更大样本验证;
  • • 未来可探索更多训练策略,如极端事件加权损失函数、多任务学习等;
  • • 需进一步研究模型是否通过区域迁移学习极端事件,以及如何优化这一过程。

六、结论

本研究揭示了AI天气模型在训练过程中对极端事件的学习机制:模型在早期就能捕获AR和TC的关键特征,但随着训练推进,这些信息被以平均误差最小化为目标的优化过程所平滑掉。通过EMA等方法融合早期权重,可以在不牺牲整体性能的前提下提升极端事件预报能力。这一发现为AI天气模型的改进提供了重要方向,也为极端天气预报的实际应用提供了理论支持。

未来,随着更多研究关注极端事件的学习机制和训练策略,AI天气模型有望在高效、低成本的前提下,实现对高影响天气的精准预报,为防灾减灾和气候适应提供有力工具。

END

声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 气象学家 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、研究背景与意义
  • 二、研究方法概述
    • 2.1 极端事件选择与定义
    • 2.2 变量与区域选择
    • 2.3 模型与训练设置
    • 2.4 评估方法
  • 三、主要研究结果
    • 3.1 热浪预报:与参考日相似,无明显退化
    • 3.2 大气河流预报:早期学习后期退化
    • 3.3 热带气旋预报:整体表现差,早期学习后期严重退化
  • 四、讨论与改进策略
    • 4.1 极端事件学习的特殊性
    • 4.2 早期停止的局限性
    • 4.3 指数移动平均(EMA)的潜力
  • 五、研究贡献与未来方向
    • 5.1 贡献总结
    • 5.2 局限性与未来工作
  • 六、结论
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档