我有一个从电子商务网站购买历史数据集。列由customer id、product id、postal code、quantity of products purchased、date of the purchase组成。有数千个不同的客户ids、数百个产品ids和大约百万行。
我运行了ARIMA模型来预测给定产品的购买量。现在,我想尝试其他分析数据集的方法,但无法找到适合该数据集的模型。为了更深入地了解这些数据,我还能运行哪些其他模型呢?
使用Python,我试图使用历史销售数据来预测产品的未来销售额。我还试图预测不同类别的产品的数量。
例如,我的列如下所示:
Date Sales_count Department Item Color
8/1/2018, 50, Homegoods, Hats, Red_hat
如果我想构建一个使用历史数据(时间)来预测每个部门/项目/颜色组合的sales_count的模型,那么最好的模型是什么?
如果我对销售做了时间线性回归,我如何解释不同的类别?我能把他们分组吗?
我会用多元线性回归,把不同的类别当作自变量吗?
我试着用Python实现真正的样本外预测。我已经研究了好几天了,没有运气。
我看到了下面给出的股票价格预测样例代码,我试图修改它来预测由热化学过程引起的温度变化(时间序列问题)。据我所知,示例代码将历史数据集(例如100个数据点)转换为'n‘天,然后将剩余的数据点分成两组,用于培训(80%)和测试(20%),然后继续预测/估计预定'n’天的股票价值。
是否有可能修改此代码以预测历史数据集之外的真实样本外因变量?
谢谢你的帮助。
from pandas_datareader import data
import numpy as np
import pandas as pd
fr
使用Python,我正在尝试使用历史销售数据来预测产品的未来销售数量。我也在尝试预测不同产品组的这些计数。
例如,我的列如下所示:
Date Sales_count Department Item Color
8/1/2018, 50, Homegoods, Hats, Red_hat
如果我想构建一个使用历史数据(时间)预测每个部门/项目/颜色组合的sales_count的模型,那么最好的模型是什么?
如果我在时间上对销售额进行线性回归,我如何解释各种类别?我可以对它们进行分组吗?
我是否会转而使用多元线性回归,将各种类别视为独立变量?