我有一个包含多个变量的数据集,其中包含缺失值,并且我不想估算或丢弃它们。我有兴趣在处理缺失的观察结果时将随机森林模型拟合到这些数据。谁能推荐专门设计的软件包或方法,用于将随机森林拟合到缺失值的数据,而不需要插补或删除不完整的记录?”
我想到了两个 OSS 选择:
XGBRFClassifier
XGBRFRegressor
请注意,这两个选项都使用最简单的方法处理缺失值 - “将缺失值发送给多数人的方式”。然而,它仍然比任何显式插补要好。