前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >prophet non-daily data非日常数据

prophet non-daily data非日常数据

作者头像
lovelife110
发布2021-01-14 14:40:34
6720
发布2021-01-14 14:40:34
举报
文章被收录于专栏:爱生活爱编程

例子代码

https://github.com/lilihongjava/prophet_demo/tree/master/non-daily_data

代码语言:javascript
复制
# encoding: utf-8
"""
@author: lee
@time: 2019/8/8 10:08
@file: main.py
@desc: 
"""
from fbprophet import Prophet
import pandas as pd


def main():
    # Sub-daily data 日以下数据
    df = pd.read_csv('./data/example_yosemite_temps.csv')
    m = Prophet(changepoint_prior_scale=0.01).fit(df)
    future = m.make_future_dataframe(periods=300, freq='H')
    fcst = m.predict(future)
    fig = m.plot(fcst)
    fig.show()

    fig = m.plot_components(fcst)
    fig.show()

    # 有规律差距的数据
    df2 = df.copy()
    df2['ds'] = pd.to_datetime(df2['ds'])
    df2 = df2[df2['ds'].dt.hour < 6]
    m = Prophet().fit(df2)
    future = m.make_future_dataframe(periods=300, freq='H')
    fcst = m.predict(future)
    fig = m.plot(fcst)
    fig.show()

    future2 = future.copy()
    future2 = future2[future2['ds'].dt.hour < 6]
    fcst = m.predict(future2)
    fig = m.plot(fcst)
    fig.show()

    # 月数据
    df = pd.read_csv('./data/example_retail_sales.csv')
    m = Prophet(seasonality_mode='multiplicative').fit(df)
    future = m.make_future_dataframe(periods=3652)
    fcst = m.predict(future)
    fig = m.plot(fcst)
    fig.show()

    m = Prophet(seasonality_mode='multiplicative', mcmc_samples=300).fit(df)
    fcst = m.predict(future)
    fig = m.plot_components(fcst)
    fig.show()

    future = m.make_future_dataframe(periods=120, freq='M')
    fcst = m.predict(future)
    fig = m.plot(fcst)
    fig.show()


if __name__ == "__main__":
    main()

日以下(sub-daily)数据

prophet可以通过观察dataframe中带有时间戳的ds列预测日以下数据的时间序列。时间戳的格式应为YYYY-MM-DD HH:MM:SS - 请参阅此处的示例数据。使用日以下数据时,每日季节性将自动拟合。在这里,我们将使用每隔5分钟的数据(约塞米蒂国家公园的每日温度)做拟合:

代码语言:javascript
复制
df = pd.read_csv('./data/example_yosemite_temps.csv')
m = Prophet(changepoint_prior_scale=0.01).fit(df)
future = m.make_future_dataframe(periods=300, freq='H')
fcst = m.predict(future)
fig = m.plot(fcst)

每日季节性显示在组件图中:

代码语言:javascript
复制
fig = m.plot_components(fcst)

有规律差距的数据

假设上面的数据集只有从12a到6a(零点到早上六点)的值:

代码语言:javascript
复制
df2 = df.copy()
df2['ds'] = pd.to_datetime(df2['ds'])
df2 = df2[df2['ds'].dt.hour < 6]
m = Prophet().fit(df2)
future = m.make_future_dataframe(periods=300, freq='H')
fcst = m.predict(future)
fig = m.plot(fcst)

预测似乎很差,未来预测数据的波动幅度远大于历史。这里的问题是我们将每日周期时间序列拟合到仅包含当天部分时间数据的时间序列(12a到6a)。因此,每日季节性在一天的剩余时间内是不受约束的,并且预测的不好。解决方案是仅对历史数据的时间窗口进行预测。在这里,这意味着将future限制为从12a到6a的时间:

代码语言:javascript
复制
future2 = future.copy()
future2 = future2[future2['ds'].dt.hour < 6]
fcst = m.predict(future2)
fig = m.plot(fcst)

同样的原则也适用于其他数据集中有规律的数据间隙的数据集。例如,如果历史数据仅包含工作日,那么应该仅对工作日进行预测,因为周末不能很好地估计每周季节性。

每月数据

可以使用Prophet来拟合月度数据。但是,prophet的底层模型是连续时间,这意味着如果将模型与月度数据拟合,然后要求每日预测,则可能会得到奇怪的结果。在这里,我们预测美国未来10年的零售额:

代码语言:javascript
复制
df = pd.read_csv('../examples/example_retail_sales.csv')
m = Prophet(seasonality_mode='multiplicative').fit(df)
future = m.make_future_dataframe(periods=3652)
fcst = m.predict(future)
fig = m.plot(fcst)

这与上面的问题相同,因为数据集有规则的间隙。当我们拟合年度季节性时,发现只有每月第一天的数据,剩余天数的季节性在组件图里是无法识别和过度拟合的。通过MCMC查看季节性的不确定性可以清楚地看到这一点:

代码语言:javascript
复制
m = Prophet(seasonality_mode='multiplicative', mcmc_samples=300).fit(df)
fcst = m.predict(future)
fig = m.plot_components(fcst)

季节性在每月开始时存在数据点是具有较低的不确定性,但两者之间具有非常高的后验方差。将Prophet和月度数据拟合时,只能进行月度预测,可以通过将频率'M'传递给make_future_dataframe

代码语言:javascript
复制
future = m.make_future_dataframe(periods=120, freq='M')
fcst = m.predict(future)
fig = m.plot(fcst)

参考资料:

https://facebook.github.io/prophet/docs/non-daily_data.html

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/08/09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 例子代码
  • 日以下(sub-daily)数据
  • 有规律差距的数据
  • 每月数据
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档