决策树后修剪和信息泄漏

决策树后修剪和信息泄漏

问题描述投票：0回答：0

据我了解，决策树的修剪有两个目标：

我的问题是针对后修剪的：在这种类型的修剪中，我们使用验证测试来（重新）构建我们的模型（至少使用减少错误的修剪方法）。然而，验证集的最初目的是调整我们的参数。所以我的问题是：

这种剪枝不会引入信息泄露吗？
在这种情况下，我们是否需要进一步单独的集合（类似于 training_1/training_2/validation & testing，其中 training_1 最初用于构建树，training_2 用于修剪）？

machine-learning

decision-tree