如果数据集中的某些实际值为0,如何计算MAPE?

问题描述 投票:0回答:1

我是数据科学的新手,试图理解预测与实际之间的差异评估。

假设我有实际情况:

27.580
25.950
 0.000 (Sum = 53.53)

我使用XGboost的预测值是:

    29.9
    25.4
    15.0 (Sum = 70.3)

仅根据总和进行评估会更好吗?示例将所有实际值减去所有预测值?差异= 70.3-53.53?

还是最好根据MSE,MAE,RMSE,MAPE等预测误差技术评估差异?

自从我读到MAPE被最广泛接受以来,如上面的实际情况所示,在分母为0的情况下如何实现?

是否有更好的方法来评估与实际的偏差,或者这是唯一合法的方法?我的目标是建立更多涉及不同变量的预测模型,这些模型将为我提供不同的预测值,然后选择与实际偏差最小的模型。

statistics data-science forecasting usage-statistics predictive
1个回答
0
投票

如果要基于每个点或总和进行评估,则取决于您的数据和用例。

例如,如果每个点代表一个时间段,并且每个时间段的准确性很重要(例如对于一个生产计划而言,那么我需要对每个时间段进行评估。

如果要测量总和的准确性,那么您也可以根据总和进行预测。

关于您对MAPE的问题,那么您在这里提到的问题将无法解决。为了使MAPE有价值,您的数据必须为非零。如果仅评估一个时间序列,则可以使用MAE,这样就不会出现精度无限/不确定的问题。但是,有许多方法可以测量准确性,而我的经验是,这在很大程度上取决于您的用例和数据集,哪一种是更可取的。有关准确性测量的一些优点,请参见Hyndman's article on accuracy for intermittent demand

© www.soinside.com 2019 - 2024. All rights reserved.