SPSS和统计模型中逻辑回归的不同p值

问题描述投票：0回答：1

我尝试使用statsmodel在Python中进行单变量分析（二进制逻辑回归，每次都有一个特征，以计算不同特征的p值。

for f_col in f_cols:
    model = sm.Logit(y,df[f_col].astype(float))
    result = model.fit()
    features.append(str(result.pvalues).split('   ')[0])
    pvals.append(str(result.pvalues).split('   ')[1].split('\n')[0])

df_pvals = pd.DataFrame(list(zip(features, pvals)), 
           columns =['features', 'pvals']) 
df_pvals

但是，SPSS中的结果不同。 NYHA方法中sm.Logit的p值为0。所有p值都不同。

在statsmodel中使用sm.Logit进行二进制逻辑回归是否正确？
为什么结果之间有差异？可能sm.Logit使用L1正则化？
我应该怎么弄？

非常感谢！

python statistics statsmodels spss

1个回答

0
投票

SPSS回归建模过程会自动包括常数或截距项，除非被告知不要这样做。正如Josef所提到的，statsmodels似乎要求您显式添加一个拦截器。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.