所有主要的多项式分类算法(XGBoost、LightGBM、CatBoost)都有
predict()
方法生成预测类别向量,以及 predict_proba()
方法生成每个预测类别的概率矩阵。
我想根据个人预测的正确程度,考虑其他类别的概率,对类别内的预测进行排名。
示例: 我在下表中有两个概率的预测(
predict_proba()
的输出),都选择 A 类作为预测,概率相同为 40%,但第二个更糟糕,因为 C 类具有几乎相同的概率:
A | B | C | D |
---|---|---|---|
0.4 | 0.2 | 0.2 | 0.2 |
0.4 | 0.105 | 0.39 | 0.105 |
我应该如何构建可用于排名的公式?