首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >可以选择哪些预测模型?

可以选择哪些预测模型?
EN

Data Science用户
提问于 2018-10-05 10:27:06
回答 1查看 36关注 0票数 0

我刚开始做数据分析。我从区域环境中心得到了一些数据。

测量:日期时间,PointID,SubstanceID,值(空气中物质浓度),MeteoID,NextValue

气象资料: MeteoID、日期时间、温度、风速、风速、湿度、气压、降水。

物质(8种物质(CO、Cl2、NO2等),其中5种有120万条记录):SubstanceID、Name、MaxVal (最高允许浓度值)。

点(9个静态监测站):PointID、入口、经度、纬度。

测量表包含约800万项空气中物质浓度比的记录(当地mysql)。我将测量数据和计量数据(最近的时间)链接起来,并将下一个值添加到测量记录中。测量之间的间隔时间为20分钟(平均而言,某些时段的数据被漏掉)。

我想做一个预测数据分析,并得到物质浓度的短期预测,取决于先前的数值和天气数据(可能是几个小时)。我仍在考虑可以选择哪种方法、技术。我想考虑不同的方法。哪个工具包最适合这种情况?是否应将数据视为多维时间序列?我目前正在研究某种神经网络的方向和python中的实现(但我仍然不知道是哪个包)。

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-10-05 10:40:00

是否应将数据视为多维时间序列?

这取决于目标变量(您想要预测的变量)是否取决于其他变量。如果没有,就没有必要这样做。一种快速检验变量是否是线性相关,因此多维预测是有意义的方法是检查变量的线性相关性。然后,只选择与目标变量具有高度相关性(>0.5)的变量,以便将它们包含在预测模型中。

我仍在考虑可以选择哪种方法、技术。

我推荐的时间序列预测模型是一个递归神经网络。这是因为它具有将先前的时间步骤存储在记忆中并将其纳入未来预测的固有能力。这是非常重要的,因为它是利用样本之间的时间依赖性的少数方法之一。

我目前正在研究某种神经网络的方向和python中的实现(但我仍然不知道是哪个包)。

在Python中实现递归神经网络最方便的方法是使用喀拉斯框架。请仔细阅读这个教程,因为它肯定是解决问题的非常好的第一步。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/39227

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档