我正在研究客户流失模型,我有一些疑问要确认是否由于某些功能而存在目标泄漏。请查看以下详细信息:
客户群:截至 12 月 22 日 响应(目标)定义:与去年同季度:2 月 3 月 4 月 (FMA'22) 相比,本季度:2 月 3 月 4 月 (FMA'23) 的客户银行余额减少 60% 或更多
例如;如果客户 2 月 3 月 4 月 (FMA'22) 的 AQB(平均季度余额)为卢比。 1,00,000,跌至卢比。 2 月 3 月 4 月(FMA'23)有 40,000 个,那么客户将是我们的目标(目标 = 1)
问题陈述:
在拟合模型进行预测时,我是否应该使用 FMA'22 的 AQB 作为特征,否则会导致目标泄漏(因为它被用于目标的计算)。
我在这两种情况下都安装了模型:
如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。
请求您帮助了解这是否是目标泄漏的情况?
我在这两种情况下都安装了模型:
如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。
请求您帮助了解这是否是目标泄漏的情况?
您是否尝试过使用卡方计算特征相关性的热图,然后使用cramer's V。请仔细阅读并在删除一些高度相关的特征(>.30)后尝试训练。