data=pd.read_csv("https://raw.githubusercontent.com/sharmaroshan/Online-Shoppers-Purchasing- Intention/master/online_shoppers_intention.csv")
我想基于方差分析进行特征选择(分类变量与数字变量)。
因变量。收益 独立变量:Administration,Administration_Duration Administrative,Administrative_Duration
import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
model = ols('Revenue ~ Informational',data = data).fit()
anova_table=anova_lm(model)
但得到以下错误。
问题与列有关 Revenue
在数据中,因为它是布尔值.事实上,如果你从布尔值转换为整数,那么它的工作。
data.Revenue = data.Revenue.astype(int)