SPSS和统计模型中逻辑回归的不同p值

问题描述 投票:0回答:1

我尝试使用statsmodel在Python中进行单变量分析(二进制逻辑回归,每次都有一个特征,以计算不同特征的p值。

for f_col in f_cols:
    model = sm.Logit(y,df[f_col].astype(float))
    result = model.fit()
    features.append(str(result.pvalues).split('   ')[0])
    pvals.append(str(result.pvalues).split('   ')[1].split('\n')[0])

df_pvals = pd.DataFrame(list(zip(features, pvals)), 
           columns =['features', 'pvals']) 
df_pvals

但是,SPSS中的结果不同。 NYHA方法中sm.Logit的p值为0。所有p值都不同。enter image description here

  1. 在statsmodel中使用sm.Logit进行二进制逻辑回归是否正确?
  2. 为什么结果之间有差异?可能sm.Logit使用L1正则化?
  3. 我应该怎么弄?

非常感谢!

python statistics statsmodels spss
1个回答
0
投票

SPSS回归建模过程会自动包括常数或截距项,除非被告知不要这样做。正如Josef所提到的,statsmodels似乎要求您显式添加一个拦截器。

© www.soinside.com 2019 - 2024. All rights reserved.