对于sklearn GridSearchCV,如何保证每个折线的训练集中都能代表类?

问题描述 投票:0回答:1

当做输出为0和1的LogisticRegression,并使用GridSearchCV进行5折交叉验证时,我得到了。

ValueError: This solver needs samples of at least 2 classes in the data, but the data contains only one class: False

很明显,这是因为对于这个特定的分类器来说,在我所使用的数据分割中,True或1值的数量较少。 如果选择了一个分割,使训练集只有上述的0,那么似乎是浪费了一个折子,因为分类器将返回nan的分数。

有什么办法可以保证每个训练拆分都包含两个类?

scikit-learn logistic-regression gridsearchcv
1个回答
0
投票

你要找的是 分层K字型. 这样就可以保持折线之间的相对百分比。

© www.soinside.com 2019 - 2024. All rights reserved.