中国快递包裹总量的预测-基于SARIMA模型

国家邮政局发布的数据显示,2015年4月底,快递业务量完成15亿件,同比增长50.9%。目前,快递业务量增速已连续50个月超过50%,尤其是网购旺季(双十一、双十二等),我国快递包裹在当月的总量在世界范围内没有任何国家可以相比。 电子商务的兴盛有效带动快递行业的高速发展,反之,快递行业的提升也为电子商务的增长提供配套支撑。

不过,快递业在迅猛发展的同时,也让行业“亚健康”的现状越发凸显。业内人士表示,虽然国内快递行业仍在高速增长,但目前运营“压力山大”,比如人员、车辆、场地等问题。

国家统计局网站公布的快递包裹量数据可以看作是标准的时序数据,但与普通时序数据不同的是,它的数值变化存在明显的季节性波动。处理季节性时间序列只用ARMA方法是不够的。描述这类序列的模型之一是季节时间序列模型(Seasona ARIMA Model),用SARIMA表示。

本文旨在通过SARMA模型研究中国快递包裹总量变化情况,并测算合理参数构建模型用于预测,以帮助有关部门提前了解快递量需求,做好相应对策。从国家统计局网站下载2003年1月至2014年12月的快递量-当期值(万件),首先,通过时间序列图对快递包裹量变化情况作一个直观判断。

上代码,R语言实现:

install.packages("forecast")

library(tseries)

#加载时间序列程序包

library(forecast)

require(graphics)

#快递包裹量(国家统计局数据)

ts.plot(exp)

#作这个时间序列的图,通过图作一个直观判断

从上图可以看出,从2008年开始,我国快递包裹量呈级数增长,并且存在明显的周期性变化,快递行业在此期间飞速发展。这种周期是由于季节性变化(包括季度、月度、周度等变化)或其他一些固有因素引起的。这类序列称为季节性序列。在快递包裹运输领域中,季节性影响是不可避免的。处理季节性时间序列只用ARMA方法是不够的。描述这类序列的模型之一是季节时间序列模型(Seasonal ARIMA Model),用SARIMA表示。

par(mfrow=c(1,2))

acf(exp)

#查看自相关图

pacf(exp)

#查看偏相关图

经过图形观察,可以初步判断出:

1.我国快递包裹量有明显呈级数增长趁势;

2.包裹量的变化存在季节性因素;

3.通过自相关-偏自相关图可以看出,应该使用MA()模型来拟合。

接下来使用R软件时间序列包的decompose函数对包括时序数据进行分解,分别为随机、趋势、季节。

x<-decompose(exp)

#通过decompose 进行分解:随机、趋势、季节

plot(x)#作图查看

通过随机、趋势、季节三张图可以看出,我国快递包裹量呈级数增长;包裹量的变化存在季节性因素;时序随机性变化平稳。

plot(x$seasonal)

通过以上分析,选择ARIMA(0,1,1)(0,1,1)[12]模型拟合数据效果最好,下面进行模型定阶检验:

exp.fit <- arima(exp,order=c(0,1,1), seasonal=list(order=c(0,1,2), period=12))nobs(exp.fit)

## [1] 131

tsdiag(exp.fit)

模型预测

arimafit<-auto.arima(exp)

plot(forecast(arimafit,h=20))

exp.forecast <- forecast(exp,4)

#给出80%,95%置信度下的置信区间,向前预测12期,默认情况下24期

plot.forecast(exp.forecast)

b=exp.forecast$mean #2015年预测值

a=c(144570.40,81779.50,142537.80,151483.90)

#2015年真实值

(b-a)/a

#误差

## Jan Feb Mar Apr

## 2015 0.7768333 1.3146107 0.8487638 0.6584730

除了二月份,其余三个月的预测值可以说非常准。二月份之所以不准,主要原因是赶上春节假期,全国休假,包裹量骤降是必然的。

综上所诉,针对带有季节波动性的时序数据,SARIMA模型明显优于ARIMA模型。通过SARIMA模型的预测结果可以看出,今后几年,我国快递行业将保持持续快速发展态势。

全国还有将近一半的乡镇不通快递。在这些乡镇,人们网购还不像北上广等大城市居民那样方便。还有很多农民盼望着快递企业可以帮助他们利用网络打开市场。因此,中国快递市场增长空间仍然十分巨大。


原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-09-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏龙行天下CSIEM

科学瞎想系列之六十一 说说噪声

上节课老师说了振动,振动和噪声是不可分割的孪生兄弟,振动在介质中传播就形成声波,声波传到宝宝们的耳朵里就形成了噪声(也有说噪音的)。今天老师就给宝宝们说说噪...

2944
来自专栏龙行天下CSIEM

科学瞎想系列之十八 能源危机的化解

上回说到,能源危机其实不是能量没了,只是越来越不好用了,那么如何才能化解这个危机呢?推广可再生能源是一个不错的点子。 有人会问了,你不是说能量...

2737
来自专栏人工智能快报

人工智能力助肾脏诊断

科研人员利用超级计算机和人工智能技术对肾脏受损程度和寿命进行了预测。 现在,科研人员已经能够通过基于人工智能(AI)的超级计算机模型,借助患者前往医院进行肾脏活...

3568
来自专栏新智元

长尾有多长:人工智能先驱与分形之父的幂律之争

【新智元导读】因为在人工智能等方面的突破性研究荣获图灵奖的赫伯特·亚历山大·西蒙(Herbert Alexander Simon)曾就幂律及其产生机制的问题与被...

3206
来自专栏专知

NIH发布包含10600张CT图像数据库 为AI算法测试铺路

美国国立卫生研究院(NIH)最近发布了一个庞大的胸部X光数据库,现已公开近10600张CT扫描图像,以支持医疗人工智能算法的开发和测试。这个大型成像数据库被称为...

762
来自专栏大数据挖掘DT机器学习

用R语言对上海市链家二手房数据分析

via : https://mp.weixin.qq.com/s/DS4fFs0-rLD0UPkdTwQ5k 如果你手上有一批数据,你可能应用统计学、挖掘算...

4148
来自专栏思影科技

脑电研究:睡眠中的婴儿大脑预测发育情况

传统观点认为九个月大之后的婴儿才能建立真正词汇的语义长程记忆,之前都处在呀呀学语的原词状态。来自德国柏林洪堡大学的学者Manuela Friedrich等人探索...

2544
来自专栏思影科技

AD与MCI患者白质纤维束的减少(基于FBA分析)

来自澳洲Florey 神经科学与心理健康研究所的Remika Mito在Brain杂志上发文,基于全新的FBA(fixel-based analysis...

3426
来自专栏AI科技大本营的专栏

AAAI 2018 杰出论文出炉,两位中国留学生共同获奖

编辑 | 周翔 作为人工智能的顶级会议,AAAI 2018 将于 2.2~2.7 在美国路易斯安那州的新奥尔良举行。然而,大会还没开始,获奖信息就已经在网上传播...

35114
来自专栏Soul Joy Hub

《基于机器学习的企业定价算法研究》阅读笔记

http://blog.csdn.net/u011239443/article/details/78126591 《基于机器学习的企业定价算法研究》 冯...

3534

扫码关注云+社区