先说看完整篇文章我的感受。整篇文章的工作量很大,且质量非常高!这是目前我看到的国内做AI气象研究最好的文章之一。不管你是气象AI研究的初学者还是已有所经验,这篇文章都能给你带来新的认识。这篇文章测试了目前常用的深度学习框架,实验设计非常全面且严谨,同时考虑了深度学习模型的可解释性问题,必读且精读的文献之一!
以上仅是个人看法,如有不同意见,也不接受反驳
以下是对此文章的编译和解读,如有不妥之处敬请指正。
南大谈哲敏教授团队近期的研究提出了基于先验物理信息增强的深度学习模型(DeepTCNet),估计卫星红外图像观测的热带气旋(TC)强度和风半径。相比于常规方法,加入TC的物理信息的数据驱动模型能够实现更好的性能。本文主要是内容是:1)耦合物理信息估计TC强度的单任务学习;2)耦合物理信息的TC风半径估计的多任务学习。
相比于无增强模型,加入TC丰满度(fullness)物理增强的DeepTCNet在TC强度估计方面实现了12%的性能改善;同时学习TC风半径和强度任务,相比于仅学习四个风半径的任务,其性能改善了6%,相比于仅学习单个风半径的任务,性能改善了9%。通过评估,DeepTCNet方法与卫星联合技术(SATCON)相当,优于高级Dvorak技术(Advanced Dvorak Technique)。
模型输入数据来源于 GridSat-B1
的逐3小时8km分辨率的TC中心的卫星红外观测;输出/标签为TC强度(MSW和MSLP)和风半径(R34, R50, R64 和 RMW),数据来源于 IBTrACS
数据库。
额外的输入信息包括,雷暴的位置和移动以及TC丰满度,这些信息来自 TC Vitals
。
通过减去平均值除方差对红外观测进行归一化。同时,考虑到TC强度和尺度的物理特性,确定了强度估计和风半径估计的图像的大小,并删除了不满足物理一致性的样本。
训练集为2005-2015年TC事件;验证集为2016和2018年TC事件;测试集为2017和2019年TC事件。此外,利用1990-2004年的数据作为测试数据量对模型性能影响的额外数据集。
飞机侦查观测作为 ground truth
用于评估DeepTCNet模型的性能。
考虑到深度学习模型层、深度和卷积核大小和数目的不同,CNN模型有不同的架构。此研究测试了目前比较常用的架构。同时考虑到模型的训练通常存在一些偏差,此研究针对相同的训练集训练了5次,并取平均进行验证。
最优模型架构是具有13层且卷积核大小为 3x3
的VGGNet模型,其中包括10个卷积层和3个全连接层,如下图所示。
所采用的CNN架构
此研究采用上述DeepTCNet作为单任务学习(STL)和多任务学习(MTL)的框架,STL是训练深度学习的标准方法,MTL可以同时学习多个任务。MTL的优势在于可以利用共享的信息或包含在相关任务中的关系。在模型训练数据较少时,MTL能够改善模型的准确性和通用性。
研究采用MAE
作为损失函数,优化器为Adam
,学习率为 1e-3
,批大小为48
。关于训练的一些细节信息,这里就不多说了,感兴趣的可以去看论文。
在TC强度估计方面,此研究进行了大量的试验,包括:
年龄
、雷暴的速度及TC的丰满度
每一种物理信息的引入对TC强度估计几乎都有正效应,其中丰满度对TC强度估计有显著改善,所有物理信息都加入改善最明显,雷暴速度和表面信息的改善效果最低;
训练过程中,加入物理信息在训练初期可以降低估计误差,这表明物理信息有助于模型放弃一些数据中的无效特征,从而加速学习过程。风半径部分的试验思路和TC强度估计的思路类似,但这里采用的是MTL方法,同时与STL方法进行了对比,即利用STL对每一种风半径进行预测和利用MTL方法对所有风半径进行同时预测。
此外,还对比了加入TC强度信息的效果,结果指出,MTL方法对风半径估计的效果优于STL方法;加入TC强度信息可以增强风半径估计。
文中指出,比较有意思的是MSW对于内核风半径估计改善更明显,而MSLP更有利于外核风半径的估计。
考虑到一直以来CNN都是黑箱模型,而CNN是如何决策的对于理解模型而言是至关重要的。此研究利用显著图和层间相关传播(LRP)方法解释DeepTCNet模型是如何进行预测的,试图理解什么输入特征导致了模型做出了预测。
显著图和LRP解释结果指出,模型学习了不同的特征以估计不同的TC参数。显著图和LRP的结果在模型的解释方面显示出了不同的特点。比如大的和小的TC R34的LRP结果具有非常明显的差异,更大的TC具有更大范围的LRP值。
DeepTCNet估计强度和尺度时的输入图像和解释的热力图
总的来说,利用合适的解释方法的CNN可以更好的探索更复杂的TC机制,但仍需要进一步研究更高级和有效的可解释性方法。此部分更详细的内容建议进一步阅读论文。
对于非常强的TC强度估计效果一般,这可能是由于无法解析TC眼的红外图像比例很高,以及这些强度的TC的案例很少。此外,训练所用的是2016年之前的数据集,可能缺少近些年的强度很高的案例。加入基于微波的卫星观测和recon-aided
观测能够进一步改善TC强度和尺度估计。
此研究结果指出,1)引入物理信息可以有效改善模型的强度估计;2)MTL可以通过共享任务间不同和更普遍的特征,从而改善模型的风半径估计;3)利用MTL同时估计TC强度(MSW和MSLP)和风半径(R34,R50,R64和RMW)能实现最佳性能;4)利用最近的连续红外观测能够进一步改善模型强度估计;5)高更多的质量的训练样本(比如飞机观测)对于改善强度和尺度估计尤其关键;6)评估结果指出,DeepTCNet的结果与SATCON一致,并显著优于ADT方法。
短期内,深度学习仍面临数据限制的问题,尤其是对于TC之类的极端天气系统。因此,探索和开发合适的方法耦合TC的物理信息到深度学习模型中将是未来研究的关键。
后话
看了这篇文章感触颇多,国内做AI+气象研究的团队还是不多,至少我了解的不多,有些组在默默无闻做研究,在这方面的交流较少,公众号大多宣传的也都是国外的AI+气象研究,我们也应该让更多的人了解国内AI+气象方面的优秀研究进展,并促进国内AI+气象相关研究者的交流。
—END—