spark XGBoost分类模型的阈值

问题描述 投票:0回答:1

如何为XGBoost分类器设置最佳阈值?该算法中使用的默认值为0.5。我想知道是否可以使用任何功能/内置功能来更改此设置。

apache-spark-mllib xgboost
1个回答
0
投票

[如果使用python:您正在寻找predict_proba() python API,而不是通常的predict() API。使用predict_proba(),您可以获得概率,然后可以根据阈值将其映射到任何类别。

由于您提到了spark mllib,所以您可能在xgboost4j中使用scala或java。在这种情况下,也存在选择。例如https://xgboost.readthedocs.io/en/latest/jvm/scaladocs/xgboost4j/ml/dmlc/xgboost4j/scala/Booster.html#predict(data:ml.dmlc.xgboost4j.scala.DMatrix,outPutMargin:Boolean,treeLimit:Int):Array[Array[Float]],您正在寻找outPutMargin

© www.soinside.com 2019 - 2024. All rights reserved.