嗨,我正在使用随机森林来构建模型,并且我试图处理空值。会有人碰巧知道如何强制随机森林模型将空值视为其自己的单独频带吗? (因为空值永远不会与其他值范围捆绑在一起。因此,在决策树中,度量的空值始终具有自己的分支)。
我不想使用均值而不是空值,因为我不希望模型将空值与其他接近均值的值捆绑在一起,我也不想删除空值。
我想要它,以便决策树始终将度量的空值视为其自己的分支。
谢谢:)
您可以尝试这些。
示例
让'feature'为仅具有正值的列的名称,那么负值应足以满足null。
dataframe.loc[dataframe['feature'].isna(), 'feature'] = -100
示例
让'功能'为具有空值的列的名称
dataframe['feature_isnull'] = 0 #null-tracking column
dataframe.loc[dataframe['feature'].isna(),'feature_isnull'] = 1