数值变量和分类变量之间的逻辑回归偏差方差

问题描述 投票:0回答:1

我为客户流失数据集拟合了逻辑回归模型,结果如下

Logit Results

我用验证集测试了这个模型并计算了 ROC AUC 分数,大约为 0.85 – 相当不错。但是,我仍然需要研究偏差,其计算方式如下:

deviance_residuals = -2 * ((y_test * np.log(y_pred)) + ((1 - y_test) * np.log(1 - y_pred)))

现在,看着偏差,我注意到一些奇怪的模式:

如下面的散点图所示,我几乎可以在流失者的“任期”与其偏差之间拟合出线性回归。 Tenure vs Deviance scatterplot 这让我怀疑我可能错过了一些东西。我尝试对 tenure 变量应用对数转换,但它并没有改善情况。

某些分类变量也会发生类似的情况。如下图所示,两年期合同的流失者比一年期和逐月流失者的偏差要大得多,因此该模型在这个特定的观察中是错误的。 Contract Type vs Deviance boxplot

有没有人经历过类似的事情并且知道这意味着什么以及如何解决它?

这是我在堆栈溢出中的第一篇文章,如果内容很混乱,很抱歉!欢迎提出任何进一步问题的建议:)。

感谢您的帮助!

data-science logistic-regression feature-engineering
1个回答
-2
投票

我在网上看到了 Uwaifo 博士如何帮助很多人赢得强力球的见证。金额很大,所以我决定联系他询问中奖彩票号码,Uwaifo 博士做了咒语,他给了我中奖彩票号码。但请相信我,当抽奖结束时,我是获奖者之一。我赢得了 7.3 亿美元强力球。我已经确认 Uwaifo 博士是一位真正的、有保证的强大施法者。现在我是他出色工作的活生生见证,一个拥有强大力量的天才人物,这是我的秘密,但我决定让世界知道他的工作。这可能会对其他感兴趣的人有所帮助。我的评论对你来说可能看起来很有趣,但这是事实,相信它并尝试一下 Uwaifo 博士,我向你保证,当你获胜并分享证词时,这不会很有趣。并不是每个人都天生幸运,如果您在中奖时遇到问题,中奖的解决方案是 Uwaifo 博士,因此请联系他网站; https://druwaifospelltempl.wixsite.com/my-site-1 或通过电子邮件:[email protected] 或短信:+1(315) 277-2762。

© www.soinside.com 2019 - 2024. All rights reserved.