无论是动态时间扭曲还是时间序列的某种欧几里德k均值聚类,(几乎?)总是需要考虑数据的不规则间距,数据长度不相等和/或数据丢失。
虽然意识到这些问题中的每一个都有其自身的考虑因素,但总的原因为何不能用样条对每个时间序列进行预处理以内插(或最小限度地外推)数据来改善这些问题?
我不明白为什么不这样。我认为主要要考虑的是您正在做的假设。至少对我而言,这种程序想到的假设是
样条曲线可以充分描述(平滑)每个时间序列,和