随机森林算法中的置信度与概率

问题描述 投票:0回答:1

我一直在尝试使用

scikit-learn
运行随机森林分类器。我想了解概率和置信度之间的区别。假设我们有 5 个类别 A、B、C、D、E 。现在,如果我运行
predict_proba()
并获得 A 类的匹配项,返回的概率是否是 5 个类中 A 类的概率?这意味着如果 A 类的概率为 0.95,那么剩余的 0.05 会为其余类共享?如果是这样的话,我想了解是否有办法获得预测的置信度,这意味着分类器以 0.95 的概率预测 A 类的置信度有多大?有这样的机制吗

我想了解这一点的原因是因为假设我输入的分类数据不属于这 5 个类别中的任何一个,我想抛出它不属于这 5 个类别中的任何一个。我觉得分类器目前会尝试将其放入 5 个类别之一,并且可能会返回很高的概率?即使它对此没有信心?

python machine-learning scikit-learn random-forest
1个回答
1
投票

概率不是置信区间。

要添加置信区间,您需要使用此扩展http://contrib.scikit-learn.org/forest-confidence-interval/

© www.soinside.com 2019 - 2024. All rights reserved.