我有非常不平衡的数据,其中大约 96% 是 1 类,其余是 2 类,我在网上阅读了很多内容来解决上述问题,在 XGBOOST 文档中,他们建议使用 scale_pos_weight 和 max_delta_step 来处理不平衡数据,有人可以告诉我如何做吗它们是否可以防止错误分类以及两者之间有什么区别。
max_delta_step
参数可以限制对模型所做的更改量。
对于不平衡的数据集,学习算法可能会尝试在多数类的方向上过多地更新模型,从而增加倾斜或偏差。
max_delta_step
可以帮助限制这种变化,有效限制每个提升步骤的变化量。
此解释也可能有帮助:https://xgboosting.com/configure-xgboost-max_delta_step-parameter/