基于长短期记忆网络的空气污染物浓度预测方法与验证

在前期的研究中,我们只关注污染物本身的时间状态变化,通过自回归移动平均模型(ARMA)+小波分解预测过一波,但这种方法没有考虑影响污染物浓度扩散的气象条件,而且也很难将空间因素考虑进去。这篇文章中提到的LSTME模型考虑预测输入数据的多样性和多元化。

我们所用到的基础框架长短期记忆网络(LSTM)是非常有名的循环神经网络(RNN)的一个变种,它将前期信息与当前任务连接,能够学习长期依赖关系,记住信息很长一段时间几乎是他们的固有行为,但不是去努力学习。利用该基础框架,我们在目标预测数据类型的基础上融入了辅助气象数据(如空气湿度、温度、风速、可见度),对不同时间周期的数据类型采用独热编码方式泛化输入特征。实验结果证明预测精度比常规的模型有显著的提高。

空气污染是一个严重的环境问题。某些空气污染物,如PM2.5(空气动力学直径小于或等于2.5mm的颗粒物质)可以在吸入过程中穿过鼻腔通道并到达喉部甚至肺部。空气污染物浓度预测是通过对关键空气污染物提供预警来保护公众健康的有效方法。传统时序预测模型往往没有考虑相邻站点之间的空间相关性,并且对于站点历史数据的长期依赖关系建模能力不足。

本文给出了一种基于LSTM神经网络的空气污染物浓度预测方法。LSTM又称为长期短期记忆神经网络,是一种特殊RNN网络。与传统的RNN不同,LSTM神经网络能够学习长时间序列,并且不受梯度弥散问题的影响。这些特征对于模拟时空大气污染物过程的建模尤为重要,在这些过程中,一个站的空气污染物浓度与之前的状态相关,并且由于污染物传输过程而与附近站的空气污染物浓度相关。

近年来,LSTM神经网络已成功应用于许多涉及时间序列预测的研究,如交通流预测(Lv等,2015)、风力预测(Felder等,2010)、人类轨迹预测(Alahi等,2016)等。最近,Sak等(Sak等,2016)采用LSTM进行污染风险预测,但仅对污染风险排序进行分类,未对空气污染物浓度进行实际值预测。此外,他们分别对各个城市做出了预测,而没有考虑监测站之间的空间相关性。本文旨在将LSTM神经网络扩展到时空相关建模和空气污染物浓度预测。

本文的贡献如下:

(1)扩展了LSTM神经网络以捕获大气污染物浓度的长期时空依赖性,并提出了可预测未来24小时大气污染物浓度的多尺度预测框架;

(2)该方法能够有效地自动提取大气污染物浓度数据中的时空相关性;

(3)将辅助数据整合到传统的LSTM模型中,并且该综合模型表现出比传统方法更好的性能。

数据

方法

1

时空相关性

首先,我们分析了12个站点PM2.5浓度的空间相关性。 Pearson相关系数(Pearson,1895)用于测量相关性,结果表明各个站点PM2.5浓度是高度相关的。然后我们用自相关函数分析了各个站点PM2.5浓度的时序相关性,结果表明各个站点PM2.5浓度时序是高度自相关的。考虑到站点间的高时空相关性和站点的历史状态,我们将来自所有12个站的时间延迟PM2.5浓度作为输入,并使用LSTM 网络学习这种时空相关性。

2

LSTME

本研究改进现有LSTM算法以预测区域大气污染物浓度。 LSTM 是一个门控RNN,可以有效解决长时间依赖关系,关于LSTM具体介绍见论文附录。整个预测框架如图1所示。所有监测站的时间延迟历史数据被叠加起来,构成LSTM层的输入张量(参见图1中的“main inputs”),空间相关数据中的特征长时间依赖性被自动提取出来(参见图1中的“LSTM”部分),递归箭头表示层提取过程可以重复多次以获得最佳性能。使用单热编码方法对年份和小时数据进行编码,并与提取的特征以及当前的气象数据进行合并。接下来,使用一个或多个完全连接的层(图1中的“FC”)来获得合并特征的进一步表示。最后,使用完全连接的层来生成预测输出。

图1. LSTME空气污染物浓度预测模型的网络框架

为了评估所提出的方法的有效性,在我们的实验中使用了三个指标,包括均方根误差(RMSE),平均绝对误差(MAE)和平均绝对百分比误差(MAPE)。

实验结果

1

预测性能

在为我们的预测任务确定最佳网络体系结构之后,训练集被用来训练我们的LSTME模型直到收敛。使用测试装置进行评估,图2显示了预测和观察到的PM2.5浓度。图2显示预测数据通常与观测数据一致。观测数据和预测数据之间的R2值表明解释方差的98%被模型捕获。

图2. 预测和真实污染物浓度(测试集)

2

精度比较

我们比较了所提出的LSTME模型的性能与STDL(Li等,2016),TDNN,SVR和ARMA模型的性能。这些模型使用与LSTME模型相同的训练和测试集进行训练和测试;然而,每个模型的输入数据略有不同。TDNN和STDL模型使用与我们的LSTME模型相同的输入,但网络结构不同。TDNN模型采用传统的神经网络进行特征表示,而STDL模型采用层叠式自编码器。这三个模型能够同时预测所有台站的空气污染物浓度。仅使用时间序列预测模型的SVR和ARMA模型分别使用来自单个站的输入数据进行每个站的预测实验,我们在每次预测后整合了预测性能。

此外,为了评估辅助数据的重要性,我们使用没有辅助数据的LSTM模型(图3中的虚线框)进行了另外的实验。所有模型的预测性能如表1所示。可以从表1中可以得出如下结论。首先,与三个“浅”模型(SVR,ARMA和TDNN模型)相比,三种深度学习模型LSTME,LSTM和STDL模型)表现出更好的预测性能,因为它们具有更强的时空特征的能力。这一发现与之前的研究(Li等 ,2016)一致,也即深层模型更适合建模复杂的时空过程。其次,与TDNN模型相比,基于LSTM的模型(包括LSTME模型和传统的LSTM模型)表现出更高的预测精度,RMSE。这个结果表明,LSTM可以更有效地捕获时空相关性。表1还表明,LSTME比传统的LSTM 模型表现更好,这表明辅助数据可以提高预测性能。

表1. 不同模型预测精度对比

3

多尺度预测

直观地说,不同时期的历史数据对未来的时滞有不同的影响。因此,如图3所示,我们将空气污染物浓度数据在特定的时间滞后内进行分组,以便为多尺度预测制定输入(以实心矩形表示)。表2展示了多尺度预测精度。

图3. 多尺度预测示意图

表2. 多尺度预测精度

结论

本文提出了一个基于历史空气污染物浓度数据,气象数据和时间戳数据预测大气污染物浓度的LSTME模型。 LSTME模型能够对具有长时间依赖性的时间序列进行建模,并能自动确定最佳时间滞后。

本文研究结论如下:

1)与SVR,ARMA和TDNN等传统浅层模型相比,深度学习模型表现出较好的预测性能。

2)与RNN模型相比,TDNN模型,我们的LSTME模型和传统的LSTM可以更有效地捕获时空相关性。

3)使用辅助数据,如气象数据和时间戳数据,可以显着提高预测性能。

4)我们的模型提供了预测空气污染物浓度的多尺度方法。虽然长期预测任务的预测性能降低了,但所提出的模型的性能适用于长期预测任务。

指导老师:姚晓婧、彭玲、池天河

智慧城市脉动分析团队

空间信息综合集成技术研究室

国家遥感应用工程技术研究中心

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180822A085R700?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券