当做输出为0和1的LogisticRegression,并使用GridSearchCV进行5折交叉验证时,我得到了。
ValueError: This solver needs samples of at least 2 classes in the data, but the data contains only one class: False
很明显,这是因为对于这个特定的分类器来说,在我所使用的数据分割中,True或1值的数量较少。 如果选择了一个分割,使训练集只有上述的0,那么似乎是浪费了一个折子,因为分类器将返回nan的分数。
有什么办法可以保证每个训练拆分都包含两个类?
你要找的是 分层K字型. 这样就可以保持折线之间的相对百分比。