我用 randomForest 包制作了一个很好的随机森林模型。但!!我的数据是重复测量的,因此我需要确保训练和测试数据中不使用相同的个体。我想在 randomForest 包中运行与此线程等效的内容:caret::groupKFold 和验证/测试。
这可能吗?还是我需要使用 Caret 包并为此重做模型?
我知道您可以使用 rfcv 函数在 randomForest 包中运行交叉验证,但这似乎没有考虑分组因素?
或者我应该以某种方式使用插入符中的数据分割,然后将其输入 randomForest 包模型中?
非常感谢!