我正在尝试对一些每月的时间序列数据运行一些模型。时间序列数据的长度不相等,也不是同月的起点/终点。我所拥有的是一个数字月份列和一个数字年份列。我已经从这两个变量创建了一个时间序列,并从中创建了一个tsibble
,以便我可以使用fable
包。这就是我正在做的处理时间序列数据的工作,
我在这里发布了一个模拟数据。
# Packages
library(tidyverse)
library(tsibble)
library(fable)
library(fabletools)
# Simulated data
id <- c(rep (222, 28), rep(111, 36), rep(555, 16))
year <- c(rep(2014, 12), rep(2015, 12), rep(2016, 4),
rep(2014, 12), rep(2015, 12), rep(2016, 12),
rep(2015, 12), rep(2016, 4))
mnt <- c(seq(1, 12, by = 1), seq(1, 12, by = 1), seq(1, 4, by = 1),
seq(1, 12, by = 1), seq(1, 12, by = 1), seq(1, 12, by = 1),
seq(1, 12, by = 1), seq(1, 4, by = 1))
value <- rnorm(80, mean = 123, sd = 50)
dataf <- data.frame(id, mnt, year, value)
为了使它成为一个字符,我将我的月份变量mnt
转换为一个tsibble
,
dataf$mnt[dataf$mnt == 1] <- "Jan"
dataf$mnt[dataf$mnt == 2] <- "Feb"
dataf$mnt[dataf$mnt == 3] <- "Mar"
dataf$mnt[dataf$mnt == 4] <- "Apr"
dataf$mnt[dataf$mnt == 5] <- "May"
dataf$mnt[dataf$mnt == 6] <- "Jun"
dataf$mnt[dataf$mnt == 7] <- "Jul"
dataf$mnt[dataf$mnt == 8] <- "Aug"
dataf$mnt[dataf$mnt == 9] <- "Sep"
dataf$mnt[dataf$mnt == 10] <- "Oct"
dataf$mnt[dataf$mnt == 11] <- "Nov"
dataf$mnt[dataf$mnt == 12] <- "Dec"
将月份和年份加在一起
dataf %>% unite("time", mnt:year, sep = " ")
弄得乱七八糟
tsbl <- as_tsibble(dataf, index = time, key = id)
在这一点上,我遇到了这个错误,
> tsbl <- as_tsibble(dataf, index = time, key = id)
Error: `var` must evaluate to a single number or a column name, not a function
Call `rlang::last_error()` to see a backtrace.
剩下的代码是这样的,
# Fitting arima
fit <- tsbl %>%
fill_gaps(b = 0) %>%
model(
arima = ARIMA(value),
)
fit
# One month ahead forecast
fc <- fit %>%
forecast(h = 1)
fc
# Accuracy measure
accuracy_table <- accuracy(fit)
你知道如何预处理我的数据来运行fable
包中的预测模型吗?
发布于 2019-11-21 15:21:16
在创建time
列时有两个小问题。第一种情况是,您不会将结果重新分配回dataf
数据帧,而只是将结果发送到控制台。解决这个问题将会纠正你发布的错误。
下一步是您需要一个兼容的数据类型。一个字符是不够的,您需要像tsibble
函数yearmonth()
这样的东西来完成这项工作。为此,您将看到我颠倒了unite()
调用的顺序。
相关的部分:
dataf <- dataf %>% unite("time", c(year, mnt), sep = " ") %>%
mutate(time = yearmonth(time))
https://stackoverflow.com/questions/58977755
复制相似问题