处理时间序列预测的大差距(TFT 模型)

问题描述 投票:0回答:1

我有一个每小时的时间序列数据,其中包含短的和大的缺失间隙。对于小间隙,我可以使用线性插值技术来填充缺失点,但我想了解填充大间隙的最佳实践是什么?我的目标是准备数据来训练 TFT(时间融合变压器)模型,据我所知,我不能简单地消除间隙,因为数据将不再连续,这会导致问题。我很感激任何建议,谢谢!

time-series data-cleaning forecasting data-preprocessing
1个回答
0
投票

为了填充时间序列数据中的缺失值,可以有多种方法。

  1. 前馈:简单地向前传递最后一个可用值。 F(t+1) = F(t),如果 F(t+1) 缺失。
  2. Backword Fill:简单地估算下一个可用值。 F(t) = F(t+1),如果 F(t) 缺失。
  3. 季节性填充:只需估算下一个或上一个季节性可用值,也可以取平均值。 F(t) = F(t+m),如果缺少 F(t),则 m 为季节周期。
  4. 简单多项式插值:使用多项式函数简单地插值估算值。
  5. 状态空间模型(贝叶斯预测):使用后验分布来估算缺失值。
  6. 基于模型的推理:FB Prophet 是一种很好的时间序列预测方法。人们可以使用这些方法来预测缺失数据的值,然后估算它们而不是缺失值。此外,基于树的集成方法也很好。
© www.soinside.com 2019 - 2024. All rights reserved.