我是数据分析的初学者,我使用的是过去 5 年 NBA 季后赛的数据。我制作了一个逻辑回归模型,其中游戏结果(0 或 1)是因变量。我还使用了球队是否在主场比赛(0 或 1),以及其他几个变量,如 3 分百分比、进攻篮板百分比等。但我的输出让我感到困惑。据说呆在家里并不重要,但这显然不是真的。某些变量的贝塔系数对于我认为对数赔率应该是的(19、20 等)来说太高了。我做错了什么?顺便说一句,我将 home 变量作为一个因素。
Call:
glm(formula = Win ~ ., family = "binomial", data = fivedata)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -34.428796 2.688105 -12.808 < 2e-16 ***
Home -0.008206 0.215093 -0.038 0.96957
threePCT 20.276459 1.861469 10.893 < 2e-16 ***
FTA 0.049225 0.016449 2.993 0.00277 **
FTpct 6.566342 1.152709 5.696 1.22e-08 ***
ORB 0.204625 0.032390 6.317 2.66e-10 ***
AST -0.022875 0.027131 -0.843 0.39916
STL 0.347226 0.042683 8.135 4.12e-16 ***
BLK 0.108892 0.047946 2.271 0.02314 *
TOV -0.295402 0.034487 -8.566 < 2e-16 ***
PF -0.063317 0.028169 -2.248 0.02459 *
DRB 0.336799 0.028429 11.847 < 2e-16 ***
TwoPCT 19.864978 1.963007 10.120 < 2e-16 ***
threeRate -0.315986 1.408751 -0.224 0.82252
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1167.26 on 841 degrees of freedom
Residual deviance: 574.81 on 828 degrees of freedom
AIC: 602.81
Number of Fisher Scoring iterations: 6
如果
threePCT
的范围从 0 到 1(即作为比例,而不是百分比),则 20.27
是当 threePCT
为 1 时获胜概率的增加,即获胜概率的增加一支球队的三分球命中率为 100%。
(注意:这个问题可能属于交叉验证)