我目前正在对爱荷华州艾姆斯数据集中的房价进行一些分析。我已经成功地对数据进行了争论并删除了所有缺失值等,我即将进行一些回归分析。我想建立三个回归模型,第一个具有两个最佳特征,第二个具有15个特征,第三个具有所有可用变量。我正在使用SelectKBest来进行功能选择。我的目标变量是我记录转换的'SalePrice'。出于某种原因,我总是从SelectKBest得到一个值错误。有趣的是,如果我不对'SalePrice'进行日志转换,一切正常。我检查了我的目标变量的dtype,并且正如预期的那样浮动。 有人可以帮帮我吗? 我真的很感激!
您正在使用
SelectKBest(chi2)
参数:
X : {array-like, sparse matrix}, shape = (n_samples, n_features_in) Sample vectors. y : array-like, shape = (n_samples,) Target vector (class labels).
chi2
仅适用于分类任务,而不适用于回归。您当前预测销售价格的问题是回归任务,因此也就是错误。
也许尝试f_regression
代替chi2