penalty = ['l1', 'l2']
C = np.logspace(0, 4, 10)
grid_model = GridSearchCV(log_model, param_grid={'C':C, 'penalty':penalty})
grid_model.fit(scaled_X_train, y_train)
我在最后一行收到错误。
我期望它适合训练数据,但出现错误。是否是由于从数字创建分类列时发生了某些事情?
确保训练数据中没有缺失值(None 或 NaN)(
scaled_X_train
和 y_train
)。
您可以使用以下方法来检查缺失值:
import numpy as np
# Check for missing values in scaled_X_train
print(np.any(np.isnan(scaled_X_train)))
# Check for missing values in y_train
print(np.any(np.isnan(y_train)))
如果发现缺失值,请通过插补或删除来适当处理它们。
此外,请确保您的分类列转换正确完成,并且所有特征均采用与逻辑回归兼容的格式。