在Tar get-Variable的Log-Transformation之后选择KBest ValueError

问题描述 投票:0回答:1

我目前正在对爱荷华州艾姆斯数据集中的房价进行一些分析。我已经成功地对数据进行了争论并删除了所有缺失值等,我即将进行一些回归分析。我想建立三个回归模型,第一个具有两个最佳特征,第二个具有15个特征,第三个具有所有可用变量。我正在使用SelectKBest来进行功能选择。我的目标变量是我记录转换的'SalePrice'。出于某种原因,我总是从SelectKBest得到一个值错误。有趣的是,如果我不对'SalePrice'进行日志转换,一切正常。我检查了我的目标变量的dtype,并且正如预期的那样浮动。 有人可以帮帮我吗? 我真的很感激! enter image description here

python scikit-learn feature-selection sklearn-pandas valueerror
1个回答
2
投票

您正在使用

SelectKBest(chi2)

根据documentation of chi2

参数:

X : {array-like, sparse matrix}, shape = (n_samples, n_features_in)
    Sample vectors.

y : array-like, shape = (n_samples,)
    Target vector (class labels).

chi2仅适用于分类任务,而不适用于回归。您当前预测销售价格的问题是回归任务,因此也就是错误。

也许尝试f_regression代替chi2

© www.soinside.com 2019 - 2024. All rights reserved.