在python中进行方差分析特征选择

问题描述 投票:0回答:1
data=pd.read_csv("https://raw.githubusercontent.com/sharmaroshan/Online-Shoppers-Purchasing- Intention/master/online_shoppers_intention.csv")

我想基于方差分析进行特征选择(分类变量与数字变量)。

因变量。收益 独立变量:Administration,Administration_Duration Administrative,Administrative_Duration

import statsmodels.api as sm
from   statsmodels.formula.api import ols
from   statsmodels.stats.anova import anova_lm
model = ols('Revenue ~ Informational',data = data).fit()
anova_table=anova_lm(model)

但得到以下错误。

数值错误(形状问题)

python-3.x machine-learning feature-selection anova
1个回答
3
投票

问题与列有关 Revenue 在数据中,因为它是布尔值.事实上,如果你从布尔值转换为整数,那么它的工作。

data.Revenue = data.Revenue.astype(int)
© www.soinside.com 2019 - 2024. All rights reserved.