我尝试使用statsmodel在Python中进行单变量分析(二进制逻辑回归,每次都有一个特征,以计算不同特征的p值。
for f_col in f_cols:
model = sm.Logit(y,df[f_col].astype(float))
result = model.fit()
features.append(str(result.pvalues).split(' ')[0])
pvals.append(str(result.pvalues).split(' ')[1].split('\n')[0])
df_pvals = pd.DataFrame(list(zip(features, pvals)),
columns =['features', 'pvals'])
df_pvals
但是,SPSS中的结果不同。 NYHA
方法中sm.Logit
的p值为0。所有p值都不同。
sm.Logit
进行二进制逻辑回归是否正确?sm.Logit
使用L1正则化?非常感谢!
SPSS回归建模过程会自动包括常数或截距项,除非被告知不要这样做。正如Josef所提到的,statsmodels似乎要求您显式添加一个拦截器。