在逻辑回归中,如何为python中的虚拟变量设置“参考水平”

问题描述 投票:0回答:1

我正在使用statsmodel在python中建立逻辑回归模型。由于我的许多列都是分类的,因此我使用“ get_dummies”对其进行了一次热编码。我的新数据框现在具有更多带有1和0的列。 (例如,gender1,gender2,stats1,status2,status 3等)。

使用此新数据框,如何为逻辑回归设置“参考水平”?默认情况下,我怎么知道我的参考水平设置为?

python scikit-learn regression logistic-regression statsmodels
1个回答
0
投票

我不是100%关于您的问题,但是scikit-learn中存在dummy regressor的概念。

如果您有一个数据框df,它的工作方式如下:

from sklearn.dummy import DummyRegressor
clf = DummyRegressor(strategy='mean', random_state=0)
clf = clf.fit(X, y)

还有带有import DummyClassifier的DummyClassifier。检查文档,此想法始终是预测均值或最频繁类别的基线。

© www.soinside.com 2019 - 2024. All rights reserved.