我正在使用 LSTM 模型进行多元时间序列预测,其中我的数据集是在特定时间执行的实验的集合。为了训练 LSTM 模型,我从实验数据集创建序列,在实验开始时,值重置为 0 或进行一些初始化。
index experiement temperature ph output
1 exp-1 30 7 0
2 exp-1 32 7 2
3 exp-1 33 7 3
4 exp-1 34 7 4
5 exp-1 35 7 3
6 exp-2 30 7 0
7 exp-2 32 7 5
8 exp-2 35 7 6
9 exp-2 36 7 4
10 exp-2 33 7 3
随着时间数据在实验开始时重置,我用于训练的序列数据之一将如下所示
index experiement temperature ph output
1 exp-1 30 7 0
2 exp-1 32 7 2
3 exp-1 33 7 3
4 exp-1 34 7 4
5 exp-1 35 7 3
Label: 0
基本上,由于序列不知道新实验已经开始,因此它会了解到训练时的上述值应该预测输出 0,这是不正确的。如果我只针对一个实验进行训练,则训练数据将不够,因为我无法从单个实验中生成许多序列。
有没有特定的方法来训练这些数据?如何将多个实验数据输入到我的 LSTM 中而不出现上述问题?