我想将类别权重添加到随机森林决策树库中的随机森林模型中,以考虑少数类别。
我在文档中没有找到如何做或如何在损失函数中修改它。我知道在 sklearn 库中可以轻松完成,但我对使用 TensorFlow 库很感兴趣。非常感谢大家的建议。
Tensorflow 决策森林允许用户在训练数据集中指定权重列。该列的条目将用作示例权重。这是增加班级权重的唯一方法。
当输入用
tfdf.keras.pd_dataframe_to_tf_dataset()
转换的 Pandas DataFrame 时,可以直接使用 weights=
参数指定权重列,例如,
ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_ds_pd, label="my_label", weights="my_weights")
直接输入 Tensorflow 数据集时,将权重列分离为 tf.Dataset 中的第三个通道(如 Keras 所期望的那样)。 tf.Dataset 的第二个通道必须始终是标签列。
全面披露:我是 Tensorflow Decision Forests 的作者之一。