使用SGDclassifier的predict_proba使用多类分类的多类分类置信度得分

问题描述 投票:0回答:1

我正在SGDClassifier中使用Logistic回归来执行〜10k类别的多类分类。为了获得预测结果的置信度分数,我正在使用predict_proba函数。但是对于正确和错误的预测,我得到的预测概率值为0.00026091、0.00049697、0.00019632。

[请提出标准化分数的方法,以便我可以通过过滤概率值来考虑结果

probability logistic-regression prediction multiclass-classification sgd
1个回答
0
投票

如果所有类别的概率值都非常低,则可能意味着您的分类器很难对样本进行分类。您可能需要进行一些功能设计或尝试其他模型。要标准化这些值,请看scikit-learn MinMaxScaler。这会将数据缩放为0到1之间的数字。但是正如我所说,如果所有值的概率都非常低,那么您将不会获得良好的分类结果。希望有帮助

© www.soinside.com 2019 - 2024. All rights reserved.