从没有白费的努力,也没有碰巧的成功。只要认真对待生活,终有一天,你的每一份努力,都将绚烂成花。
全文字数:4208字
阅读时间:11分钟
前言
(1)加权平均VS算术平均
个数
我们把
叫做这
个数的算术平均数,简称平均数记作
,读作
拔。
个数中,
出现的
次,
出现
次,...,
出现
次
,则
其中
叫做权。(权越大对平均数的影响也就越大)
例子:
整数的形式其实很好理解就是出现的频数。
其实这个例子的权重是股票占总股票的比重。也就是权重是一个比的形式。
▲(2)比的形式
▲(3)百分比的形式
(2)加权平均法VS移动平均法
1. 简单的移动平均法
(一次移动平均法)是收集一组观察值,计算这组观察值的均值,利用这个均值作为下一期的预测值。在移动平均值的计算中包括的过去观察值的实际个数,必须一开始就明确规定。每出现一个新的观察值,就要从移动平均中减去一个最早的观察值,再加上一个最新的观察值,计算移动平均值,这一新的移动平均值就最为下一期的预测值。
,这时利用最新的观察值作为下一期的预测值;(2)
,这时利用全部的
个观察值的算术平均值作为预测值。
,这样有利于较大的限度地平滑由随机性所带来的严重偏差;反之,当数据的随机因素较小的时候,宜选用较小的
,这有利于跟踪数据的变化,并且预测值滞后的期数也少。
移动平均法可以表示
式子中:
为最新观察值;
为下一期预测值;由移动平均法计算公式可以看出,每一新预测值是对前一移动平均预测值的修正,
越大平滑效果愈好。
个过去观察值,当需要预测大量的数值时,就必须存储大量数据;
个过去观察值中每一个权数都相等,而早于
期的观察值的权数等于0,而实际上往往是最新观察值包含更多信息,因具有更大的权重。
▲计算移动平均值例子
2. 加权移动平均法
加权移动平均给固定跨越期限内的每个变量值以相等的权重。其原理是:历史各期产品需求的数据信息对预测未来期内的需求量的作用是不一样的。除了以
为周期性变化外,远离目标期的变量值的影响力相对较低,故应给予较低的权重。
其中式子中的
是
期实际销售额的权重;
是第
期实际销售额的权重;
是第
期实际销售额的权重;
为预测时期数;
。
)会使平滑波动效果更好,但会使预测值对数据实际变动更不敏感。(也就是图像会往右移动,有时延)
补充:
指数平滑法是对加权移动平均法的改进,它是将前期预测值和前期实际值分别确定不同的权数(二者权数和为1)。只需要三个数据,所有预测方法中,指数平滑法采用较多,常用语短期预测。选择合适的
值。实际需求稳定,选取较小的
值,反之选取较大的
值。指数平滑法有很多种,有一次指数平滑预测、二次指数平滑预测以及三次指数平滑预测。我们这里说一次指数平滑预测。
代替
得到预测的通式,即:
。它既不需要存储全部的历史数据,也不需要存储一组数据,从而可以大大减少数据存储问题,甚至有时只需一个最新观察值、最新预测值和
值,就可以进行预测。它提供的预测值是前一期预测值加上前期预测值中的误差的修正值。
值,以使均方差最小,这需要通过反复试验确定。
▲计算加权移动平均法
▲计算加权移动平均法
a
指 数 加 权 移 动 平 均
说了这么多那什么是指数加权移动平均呢?其实他也是加权移动平均的一种改进。指数加权移动平均(Exponentially Weighted Moving Average),它是一种常用的序列处理方式。在
时刻,他的移动平均值公式是:
,其中
是
时刻的移动平均预测值;
为
时刻的真实值;
是权重;其实这个和上面的指数平滑预测很是相像。但是有所不同,指数滑动平均
是通过当前
时间的真实值和
时间的预测值来进行估计预测下一个时期。而我们所说的指数加权移动平均就是通过当前的实际值和前一段时期(由
约定平均了多少以前的数据)来进行平滑修改当前的值,来生成一个平稳的趋势曲线。
物理意义:系数
越小就说明对过去测量值的权重越低,也就是对当前抽样值的权重越高。这个时候移动平均估计值的时效性就越强(其实也就是更加拟合点分布的趋势)。反之,则会越弱。指数移动加权平均还有另一个特点就是能吸收瞬时突发的能力也就是平稳性(使得得到的曲线趋势能够更加平缓),如果对过去估计值的权重越低也就是
越小,那么他的平稳性就差一点,反之平稳性会增强。
举一个例子:
▲伦敦温度例子
其实这里的曲线就是当
作为移动平均的初始值,然后将对应的实际的温度值带入递归式子中,然后得出的曲线。其实从上面也可以看出来
的选择尤为的重要。这个温度的例子,吴恩达老师选择了0.9作为
的值。可以看出曲线要平坦一点,这是因为你平均了几天的温度,所以这个曲线波动更小,更加平坦,缺点就是曲线会失去时效性,在图中的表现就是曲线会向右移动,那因为现在要平均的温度值更多,要平均更多的值,指数加权平均公式在温度变化的时,能更加适应缓慢一些,所以会出现一定的延迟。
▲伦敦温度例子
通过上面两个极端值可以看出,我们可以选择一个合适的
值来使曲线既平缓又不偏离数据点。也就是不会有太多的噪声同时也不会向右偏离太多。
是一个很重要的参数,可以取得稍微不同的效果,往往中间某个值效果最好。那我们说为什么知道
值就知道他平均了多少天呢?
b
指 数 移 动 加 权 平 均 的 理 解
我们使用
来看看指数移动加权平均的原理是什么?
...
我们将式子一步一步的带入得到最终式子:
通过式子我们可以很清楚的看出对于求的
的值,可以看做是
的温度值与对应的指数衰减函数对应项相乘之后在求和。
我们上回看到当
的时候我们说平均了两天,我们发现
再去乘于0.5那么可以看出后面的数也会很小,所以我们再去考虑。同理,
的时候,
也就说平均了10天。
我们认为这个值就已经很小了,所以不再去考虑后面的数据了,所以说当
的时候只平均了10天的数据。
优势:
是用来计算数据的指数加权平均数,计算指数加权平均数只占单行数字的存储和内存,当然并不是最好的,也不是最精准的计算平均数的方法,如果你需要计算时间窗,你可以直接过去10天的总和或者过去50天的总和除以10或50就好了,如此往往会得到更好的估测,但缺点是如果保存最近的气温和过去 10 天的总和,必须占更多的内存,执行更加复杂,而计算指数加权平均数只占单行数字的存储和内存。他的效率和资源的占有率会大大的减小。所以在机器学习中大部分采用指数加权平均的方法计算平均值。
c
指 数 加 权 移 动 平 均 的 偏 差 修 正
当我们取β = 0.98的时候,实际上我们得到的并不是绿色的曲线而是紫色的曲线,通过紫色曲线我们看出在预测的初期值和我的真实值的差距很大,所以引入了偏差修正的概念。
▲偏差修正
,
那么通过指数移动加权平均的公式可以得到
那可以看出算出的
和实际
的40相比差距还是不小的。
同理
也要远远小于1号和2号数据。所以可以看出
...这样的前期移动平均值并不能很好的估测温度。
,
,可以看出比原来的效果好了很多。对于
我们可以看出,随着
的逐渐增大,
会逐渐接近与0,那么
就会逐渐接近与1,那么我们从公式上可以看出,我们的偏差修正最终会变成(如果数据多的话)
,公式最终会变成
。所以在机器学习中,在计算指数加权平均数的大部分时候,大家不太在乎偏差修正,大部分宁愿熬过初始阶段,拿到具有偏差的估测,然后继续计算下去。如果你关心初始时期的偏差,修正偏差能帮助你在早期获得更好的估测。
首发: 1. 触摸壹缕阳光~知乎 参考: 1. 深度学习~吴恩达
本文分享自 AI机器学习与深度学习算法 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!