所以我有这张桌子:
日期 | col1 | 特点1 | 特点2 | feature_n |
---|---|---|---|---|
2015-01-01 | ts1 | 4 | 0 | 1 |
2015-01-01 | ts2 | 5 | 2 | 2 |
2015-01-01 | ts3 | NA | NA | NA |
2015-01-02 | ts1 | 1 | 4 | 4 |
2015-01-02 | ts2 | 8 | 5 | 7 |
2015-01-02 | ts3 | NA | NA | NA |
假设我有 50 个时间序列,其中缺少 20 个时间序列。所以我有 ts1、ts2、.. ts30 时间序列,其中包含所有数据。但是,我想对每个时间序列进行预测,包括那些缺失的时间序列。问题是,如果可能的话,我该怎么做?
我有以下理论解决方案:以某种方式对时间序列进行聚类,这样我就会知道哪个时间序列将“更接近”另一个时间序列。之后,使用来自“接近”且未缺失时间序列的信息,对缺失时间序列中的时间序列数据中的所有特征进行预测。之后,对所有时间序列进行预测。 然而,乍一看这似乎是可行的,我认为它可能会变得非常复杂。 我认为这个问题更可能与统计方法有关,比如获取样本,然后从该样本中对整个人群进行预测。不幸的是,我不是统计专家,所以欢迎任何澄清!
提前谢谢你!