这是我的数据(简化版)。
Athletics Age Competition Result(m)
--------------------------------------------
Alex 10.2 CompA 3.2
Alex 11.5 CompB 4.3
...
Bob 9.9 CompC 3.5
Bob 10.7 CompD 5.6
...
Dave 10.3 CompB 5.2
Dave 11.6 CompD 6.3
....
我的数据是关于一组不同年龄段(8-28岁)的孩子在不同比赛中跳远的结果。
我想知道的是
我最近学习了一些关于机器学习和深度学习的知识,我知道这是一个可以用这些模型解决的问题,但是我很困惑,我应该用什么模型?
任何方向都会非常感激。
答案是两者都有。回归只是意味着在模型的输出层没有sigmoid激活。所以你可以使用LSTM或GRU这样的时间序列模型(使用这样复杂的模型可能会导致过拟合),然后用它们来进行回归。这样,模型会学习其他孩子的表现,然后用Paul的数据来预测他的表现。这不是一个分类问题! 你要预测的是继续值,而不是类。这意味着它必须是回归。
我建议阅读书籍或参加教程,我喜欢用Python进行深度学习。
你要解决的问题通常叫做面板(或监督)预测。
是否使用其他孩子的数据是一个实际问题。你可以将使用数据的模型与只使用Paul的数据的模型进行比较。
没有必要使用深度学习,但当然你可以尝试。其他标准的机器学习算法(随机森林等)或统计预测算法(ARIMA等)也可以适应解决这类问题。
现成的解决这个问题的库很少。一个是pysf,有一个关于天气数据的教程(https:/github.comalan-turing-instituteepysfblobmasterexamplesWalkthrough.ipynb。),另一种是gluon-ts(多为深度学习方法)。