我有一个名为" dataframe“的dataframe,它包含一系列特定日期的销售信息。每个日期条目的格式为YYYY-MM-DD,数据范围为2012 - 2017年。我想把这个数据帧分成6个独立的数据帧,每年一个。因此,例如,第一个拆分数据帧将包含2012年的所有条目。
我想我可以在下面的代码中做到这一点。我将每一年的数据帧拆分为一个数据帧,并将它们放入“年”列表中。但是,当我尝试在每个数据帧上运行auto_arima时,我得到错误消息“发现样本数量不一致的输入变量”。
我想这是因为我没有正确地拆分我的原始数据帧。如何根据年份正确拆分我的数据帧?
#Partition data into years
years = [g for n, g in dataframe.set_index('Date').groupby(pd.Grouper(freq='Y'))]
#Create a list that will hold all auto_arima results for every dataframe
stepwise_models = []
#Call auto_arima on every dataframe
for x in range(len(years)-1):
currentDf = years[x]
model = auto_arima(currentDf['price'], exogenous=xreg, start_p=1, start_q=1,
max_p=3, max_q=3, m=12,
start_P=0, seasonal=True,
d=1, D=1, trace=True,
error_action='ignore',
suppress_warnings=True,
stepwise=True)
stepwise_models.append(model) #Store current auto_arima result in our stepwise_models[] list
https://stackoverflow.com/questions/51072938
复制相似问题