支持Python!Facebook开源预测工具Prophet

【AI研习社】关注AI前沿、开发技巧及技术教程等方面的内容。欢迎技术开发类文章、视频教程等内容投稿,邮件发送至:zhangxian@leiphone.com

————————————————————

本周,Facebook 宣布开源一款基于 Python 和 R 语言的数据预测工具——“Prophet”,即“先知”。取名倒是非常直白。

Facebook 表示,Prophet 相比现有预测工具更加人性化,并且难得地提供 Python 支持。另外,它生成的预测结果足以和专业数据分析师媲美。

Facebook 把预测任务的流程用下图展示出来:

从图中可以看出,预测共分四个流程:建模,预测评估,表面问题和人工检查。

在建模阶段,当前可用的 Python 工具包寥寥无几。最广为人知的 “ forecast” ,谷歌开发的 CausalImpact, 以及推特的 AnomalyDetection,均是基于 R 语言。很显然,Facebook 想要改变这一点。

从 Facebook 官方声明来看,推出 Prophet,是希望用它来替代 forecast,成为最受欢迎的预测工具。相对于后者,Facebook 表示 Prophet 有两大优点:

  1. 开发合理、准确的预测模型更加直接。 Prophet 包含许多预测技术,比如 ARIMA 和 exponential smoothing。每一项工具都有它的长处、短处和调节参数。Facebook 表示,选择不恰当的模型或参数会造成让人难以满意的结果;而即便是有经验的数据分析师在选择模型、参数上也经常遇到困难。言下之意是,Prophet 将着重改善这方面的体验,让模型、参数的选择更直观。
  2. 用 Prophet 做出的预测,能够以对普通人更加直观的方式进行定制。 Prophet 有针对周期性的平滑参数(smoothing parameters for seasonality),允许开发者调整与历史周期的匹配程度。它还有针对趋势的平滑参数,能够调整对历史趋势变化的紧跟程度。对于增长曲线(growth curves),开发者能人工设置上限,即 capacities,把关于“该预测如何增长(或下降)”的先验信息注入进去。最后,开发者还能设置不规则日期,来对超级碗、感恩节、黑色星期五之类的特殊日子进行建模。

组成部分

在它的核心,Prophet 是一个可加回归模型(additive regression model),它有四个组成部分:

  1. 一个分段的线性或逻辑增长曲线趋势。Prophet 通过提取数据中的转变点,自动检测趋势变化。
  2. 一个按年的周期组件,使用傅里叶级数(Fourier series)建模而成。
  3. 一个按周的周期组件,使用虚拟变量(dummy variables)。
  4. 用户设置的重要节日表。

适用范围

Prophet 针对的是商业预测任务,适用于具备以下特征的场景:

  • 针对每小时、每天或每星期的观察频次,有至少数月(理想情况的一年)的历史记录。
  • 多重显著的“人类层级”周期性:星期X以及年份。
  • 日期间隔不规则的重要节日(比如超级碗),需要事先得知。
  • 观察缺失或是异常值在合理范围内。
  • 历史趋势变化,比如产品发布或者改写记录(logging changes)。
  • 符合非线性增长曲线的趋势,有天然上、下限或者饱和点。

想要进一步了解 Prophet 的读者,请参考以下链接:

Facebook 博客:https://research.fb.com/prophet-forecasting-at-scale/

使用指南:

https://facebookincubator.github.io/prophet/docs/quick_start.html

文件:http://facebookincubator.github.io/prophet/

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2017-02-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏有趣的Python

TensorFlow应用实战-15-强化学习常用环境

3915
来自专栏大数据文摘

学界 | MIT深度学习课程全部视频及课件开放

2324
来自专栏PPV课数据科学社区

浅谈数据处理中的相关分析

大数据的发展经历了从因果分析到相关分析的转变。宏观上来讲,如果两个事务存在某种统计学意义上的依赖性就称两者具有相关性。这里我们就简单聊聊各种相关分析的方法。 1...

3587
来自专栏大数据文摘

干货丨3分钟了解今日头条推荐算法原理(附视频+PPT)

3374
来自专栏大数据挖掘DT机器学习

今日头条算法原理全曝光!(算法架构师详细解读,建议仔细看!)

今天,算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配,但同时,算法也开始面临质疑、挑战和误解。今日头条的推荐算法,从2012年9月第一...

1.2K8
来自专栏AI科技大本营的专栏

全解今日头条大数据算法原理(附PPT & 视频)

3分钟了解今日头条推荐算法原理 来源 | 今日头条 今天,算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配,但同时,算法也开始面临质疑、挑...

5016
来自专栏计算机视觉战队

人工智能在《LOL&王者荣耀》游戏中的角色

近期LOL和王者荣耀游戏已经充斥着真个朋友圈,但是谁又知道在火热的游戏进行中,又有一批批IT男在完成另一项重要的任务,那就是利用深度学习的知识去完成游戏直播的智...

1676
来自专栏钱塘大数据

【PPT详解】曹欢欢:今日头条算法原理

作者:曹欢欢博士 今天,算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配,但同时,算法也开始面临质疑、挑战和误解。今日头条的推荐算法,从...

1.4K8
来自专栏程序员宝库

今日头条算法原理(全)

▲3分钟了解今日头条推荐算法原理 今天,算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配,但同时,算法也开始面临质疑、挑战和误解。今日头条...

4797
来自专栏计算机视觉战队

人工智能在《LOL&王者荣耀》游戏中的角色

近期LOL和王者荣耀游戏已经充斥着真个朋友圈,但是谁又知道在火热的游戏进行中,又有一批批IT男在完成另一项重要的任务,那就是利用深度学习的知识去完成游戏直播的智...

2956

扫码关注云+社区

领取腾讯云代金券