我具有多个部门(零售领域)的每周时间序列数据,并且根据一些研究,我正在自动为每个时间序列查找模型参数的过程。到目前为止,我已经在for循环中为每个时间序列实现了以下模型:
1)ARIMA(R中的auto.arima)
2)stlf(由于我有每周数据,因此无法使用R的ets函数)
3)任务
4)ARIMA错误的回归(使用傅立叶项)
5)基线模型:天真和均值
我想了解如何为每个时间序列选择模型。我对此有多种方法:
1)选择测试数据的RMSE最低的模型(风险:测试数据的过拟合)
2)在时间序列的交叉验证(tsCV)上选择具有最低RMSE的最佳模型
3)在所有时间序列中选择一个模型族,基于哪个模型在所有时间序列中给出的平均RMSE得分最低。
有什么方法可以改善我的方法?以上任何方法有什么缺点?有更好的方法吗?
非常感谢!
使用上述所有预测方法预测数据,然后计算MAPE并检查哪个模型给出了最佳结果,然后使用该模型预测数据。另外,请尝试检查输入数据的不同数据转换,例如对数,逆等。