我找不到有关如何做出正确预测的信息对于以下数据框:
train data:
id variable value statement
1 x1 431 1
1 x2 11 1
1 x3 65 1
2 x1 33 0
2 x2 2 0
3 x3 58 1
3 x1 22 1
.
.
.
need to predict:
id variable value statement
996 x1 431 ?
996 x2 131 ?
997 x3 62 ?
997 x1 33 ?
997 x2 23 ?
998 x1 18 ?
999 x1 26 ?
我想知道如果我获得相同ID的不同语句该怎么办,例如:
id statement
997 0.66
997 0.95
997 0.34
在这种情况下,我应该怎么做,我应该按ID分组并获得最大值,否则将是一个平均值...什么是正确的选择?谢谢...
@@ндрейАлексеевич我会说这取决于ID在您的DF中的含义。