



FuXi-GRAPES:当伏羲模型遇上
国产再分析数据,告别“水土不服”
导读:AI大模型在气象领域遍地开花,但如何让它们真正适应中国的业务数据?最新研究提出“FuXi-GRAPES”模型(简称FuXi-G),利用CMA国产再分析数据微调,不仅在南半球预报精度大幅提升,更精准捕捉了2023年“卡努”台风的诡异转向!

AI预报天气,为何“橘生淮南则为橘”?

近年来,以伏羲(FuXi)、盘古(Pangu-Weather)、GraphCast为代表的AI气象大模型横空出世,展现了惊人的预报能力。然而,这些模型大多使用欧洲中期天气预报中心(ECMWF)的ERA5再分析数据进行训练。当直接应用于中国气象局的实时业务数据时,由于“水土不服”——训练数据与输入数据分布不一致——预报效果往往会打折扣。而重新训练一个大模型,需要消耗巨大的算力与时间成本。

图1:2021年GRAPES与ERA5再分析数据2米温度的年平均偏差分布。图中显示,两套再分析数据在南极、青藏高原、格陵兰等地区存在明显的系统性差异,这正是导致AI模型"水土不服"的根源之一。
有没有一种既省力又能提升精度的办法?近日,发表在《Journal of Meteorological Research》上的一项研究给出了答案:微调(Fine-Tuning)。来自中国气象局地球系统数值预报中心和上海科学智能研究院的研究团队,利用CMA的GRAPES再分析数据对伏羲模型进行微调,推出了适配版本——FuXi-GRAPES(FuXi-G)。

什么是GRAPES再分析数据?

CMA-GFS是中国气象局自主研发的全球数值预报系统。基于该系统开发的第二代全球大气再分析产品(CMA-RA2)具备以下特点:水平分辨率达12.5公里,垂直方向分为87层,模式顶延伸至0.1百帕;采用增量形式的四维变分(4DVar)同化方案;融合了全球定位系统无线电掩星(GPSRO)、海面风场、风云三号卫星微波温度计和湿度计等多源观测数据。本研究使用的GRAPES再分析数据正是CMA-RA2的初步产品。
简单来说,这是一套能与中国气象局业务预报系统无缝对接的高质量大气数据产品,是让AI模型“入乡随俗”的关键。

核心方法:FuXi-G是如何炼成的?

传统的AI模型在ERA5数据上“吃得饱饱的”,但面对国产GRAPES数据时却可能“消化不良”。研究团队并没有选择从零开始训练,而是采用了一种低成本、高效率的微调策略。
▪继承“大脑”:保留原伏羲模型的主体架构和预训练权重,站在巨人的肩膀上出发。
▪本土特训:仅使用2020年一年的GRAPES再分析数据进行微调,采用渐进式自回归训练——模型预测步数从2步逐渐增加到12步,让模型循序渐进地学习更长时间的预报。
▪变量优化:为更好适配GRAPES数据特性,用比湿(Q)替换相对湿度(RH),并增加了地表气压(SP)等变量。
整个微调过程在8块NVIDIA A100 GPU上完成,相比从头训练,计算资源需求大幅降低,同时让模型“学会”了适应中国自主再分析数据的特征。

实战战绩:南半球精度暴涨,比肩NCEP

研究团队利用2021年全年数据进行了系统评估,结果令人振奋。
整体而言,微调后的FuXi-G模型预报技巧显著优于原始版本。在GRAPES数据驱动下,其时空精度已超越CMA的业务预报水平,并逐步接近美国NCEP。虽然在早期预报时段仍略逊于NCEP,但FuXi-G展现出更强的误差控制能力——随着预报时效延长,其误差增长速度明显慢于传统模式,到第五天时甚至能够反超NCEP。

图2:四个大气变量的RMSE随预报时效(1-5天)的变化。Z500、T850、U850、V850的预报误差对比显示,FuXi-G(红线)在所有变量上均优于FuXi(蓝线),且误差增长速度更慢,表明微调有效控制了误差传播。
南半球是最大亮点。原始模型由于数据不匹配,在南半球的预报误差一直是“老大难”问题,尤其是4月至10月期间,误差甚至超过了传统数值模式。微调后,FuXi-G在南半球的表现可谓脱胎换骨:500百帕位势高度的误差大幅下降,特别是在南半球冬季,RMSE相对减少了约22.1gpm,统计检验显示改善高度显著(p < 0.001)。

图3:500百帕位势高度5天预报RMSE时间序列。(a)北半球;(b)南半球。7天滑动平均结果显示,FuXi(蓝线)在4-10月误差明显偏高,而FuXi-G(红线)全年表现稳定,持续优于NCEP预报。
表1. FuXi-G在南半球各季节5天500百帕位势高度预报的改善

注:季节为南半球定义
热带地区同样表现亮眼。微调后的模型对500百帕位势高度的预报能力显著增强,有效修正了原始模型在这些区域的明显偏差。

图4:不同区域500百帕位势高度的ACC随预报时效的变化。其中(d)为热带区域。

案例复盘:精准预判"卡努"台风大转弯

2023年的超强台风“卡努”(Khanun)因其路径诡异、突然急转弯而让无数预报员头疼,是检验模型能力的绝佳案例。
各家模式表现如何?FuXi原始版预测台风将一路向西北直扑浙江登陆,180小时预报偏离实况超过1000公里。CMA传统数值预报同样漏报了转向,预测台风深入内陆。NCEP虽然报出了转向,但转向点过早且向北偏转。而FuXi-G成功捕捉到了126小时的关键东折转向,误差降低了60%以上!

图5:台风“卡努”路径预报对比及误差演变。左图为各模式预报路径,FuXi(蓝线)预测台风直接登陆浙江,误差超过1000公里;FuXi-G(红线)成功捕捉到关键转向。右图显示FuXi-G在126小时后误差明显低于FuXi。
为什么FuXi-G能赢?分析发现,台风的转向与副热带高压的断裂密切相关。FuXi-G在预报第102小时成功预测出副热带高压的断裂以及西北侧新高压脊的发展,从而准确判断出台风失去了原本的引导气流,不得不停滞并转向。相比之下,直接给FuXi模型“喂”没有见过的GRAPES再分析数据,错误地预测副高将持续引导台风向西北移动。这一案例充分证明,经过本土数据微调的AI模型,在处理高影响天气事件时具有巨大的应用潜力。

图6:500百帕高度场和850百帕风速的预报演变。FuXi-G在102小时预报中准确预测了副热带高压的断裂(红色等值线),这是台风转向的关键。

局限性与展望

当然,这项研究也存在一些局限。在近地面温度预报方面,FuXi-G的2米温度预报仍落后于主要业务中心,这与GRAPES再分析数据在南极、青藏高原和格陵兰等地区存在系统性偏差有关。此外,台风预报改善目前仅基于“卡努”一个案例验证,需要更多样本进一步检验。
未来,研究团队计划整合更高分辨率的观测数据(如卫星和雷达),并探索多源数据融合和跨域学习方法,进一步提升模型的适应性和泛化能力。

总结

这项研究不仅是一个技术验证,更指明了一条AI气象落地的新路径。它证明了通过微调策略,可以让基于ERA5训练的全球大模型低成本地适配各国自主的再分析数据系统,打破了数据壁垒。FuXi-G展现的优异误差控制能力,特别是在中长期预报中的表现,为现有的数值预报提供了强有力的补充。
正如一位优秀的厨师需要了解当地食材特性才能发挥最佳水平,AI天气预报模型也需要“入乡随俗”。我们有理由相信,随着更多高质量观测数据的融入,AI将为天气预报带来更精准的“中国方案”!
论文信息
论文链接:https://doi.org/10.1007/s13351-025-5052-y
引用格式:Zhang, Z. P., W. Han, L. Chen, et al., 2025: Fine-tuning FuXi with CMA's reanalysis data to improve forecasting. J. Meteor. Res., 39(6), 1411–1424.
作者信息:中国气象科学研究院硕士生张泽萍为本研究第一作者,中国气象局地球系统数值预报中心韩威研究员为通讯作者。合作者包括陈磊(上海科学智能研究院)、李昊(上海科学智能研究院、复旦大学人工智能创新与产业研究院)、姜立鹏、赵滨(中国气象局地球系统数值预报中心)。
资助项目:国家自然科学基金(U2442219)
相关文章:
中国气象科技的智能新突破:人工智能数据同化的一小步 —FuXi - DA
中国气象AI新突破!FuXi Weather:仅靠卫星数据,全球预报可用天数首超欧洲中期天气预报中心
风云四号静止微波星:如何让台风预报更精准?—基于GRAPES的观测系统模拟试验“OSSE”揭示未来卫星定量贡献
END
声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。