预测跳远结果:这是一个时间序列预测问题还是回归问题?

问题描述 投票:0回答:1

这是我的数据(简化版)。

Athletics    Age    Competition    Result(m)
--------------------------------------------
Alex         10.2    CompA          3.2
Alex         11.5    CompB          4.3
...
Bob          9.9     CompC          3.5
Bob          10.7    CompD          5.6
...
Dave         10.3    CompB          5.2
Dave         11.6    CompD          6.3
....

我的数据是关于一组不同年龄段(8-28岁)的孩子在不同比赛中跳远的结果。

我想知道的是

  1. 给予一个新的孩子保罗,如果我们知道他的历史(例如8 - 16岁),如何预测他的未来结果(例如在18,20,24岁)?
  2. 如果我们可以根据跳楼者的最佳成绩将其分为A-E组,那么如何预测保罗未来(比如说18岁时)会在哪一组?

我最近学习了一些关于机器学习和深度学习的知识,我知道这是一个可以用这些模型解决的问题,但是我很困惑,我应该用什么模型?

  1. 我是应该只根据保罗的历史数据来对保罗(新孩子)进行预测呢?还是我应该用其他人的数据来做,比如Alex、Bob、Dave?
  2. 这是一个时间序列预测问题,我应该使用ARIMA、ARCH、LSTM(RNN)等模型?
  3. 或者这是一个 "正常 "的监督或非监督回归或分类问题,我应该使用教科书上的模型,如线性回归,逻辑回归,KNN,NB,DT,SVM,随机森林,ANN,DNN,CNN?

任何方向都会非常感激。

machine-learning model time-series
1个回答
0
投票

答案是两者都有。回归只是意味着在模型的输出层没有sigmoid激活。所以你可以使用LSTM或GRU这样的时间序列模型(使用这样复杂的模型可能会导致过拟合),然后用它们来进行回归。这样,模型会学习其他孩子的表现,然后用Paul的数据来预测他的表现。这不是一个分类问题! 你要预测的是继续值,而不是类。这意味着它必须是回归。

我建议阅读书籍或参加教程,我喜欢用Python进行深度学习。


0
投票

你要解决的问题通常叫做面板(或监督)预测。

是否使用其他孩子的数据是一个实际问题。你可以将使用数据的模型与只使用Paul的数据的模型进行比较。

没有必要使用深度学习,但当然你可以尝试。其他标准的机器学习算法(随机森林等)或统计预测算法(ARIMA等)也可以适应解决这类问题。

现成的解决这个问题的库很少。一个是pysf,有一个关于天气数据的教程(https:/github.comalan-turing-instituteepysfblobmasterexamplesWalkthrough.ipynb。),另一种是gluon-ts(多为深度学习方法)。

© www.soinside.com 2019 - 2024. All rights reserved.