客户流失模型中的目标泄漏

问题描述 投票:0回答:1

我正在研究客户流失模型,我有一些疑问要确认是否由于某些功能而存在目标泄漏。请查看以下详细信息:

客户群:截至 12 月 22 日 响应(目标)定义:与去年同季度:2 月 3 月 4 月 (FMA'22) 相比,本季度:2 月 3 月 4 月 (FMA'23) 的客户银行余额减少 60% 或更多

例如;如果客户 2 月 3 月 4 月 (FMA'22) 的 AQB(平均季度余额)为卢比。 1,00,000,跌至卢比。 2 月 3 月 4 月(FMA'23)有 40,000 个,那么客户将是我们的目标(目标 = 1)

问题陈述:

在拟合模型进行预测时,我是否应该使用 FMA'22 的 AQB 作为特征,否则会导致目标泄漏(因为它被用于目标的计算)。

我在这两种情况下都安装了模型:

  1. 使用FMA'22 AQB(召回率:90%)
  2. 未使用 FMA'22 AQB(召回率:78%)

如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。

请求您帮助了解这是否是目标泄漏的情况?

我在这两种情况下都安装了模型:

  1. 使用FMA'22 AQB(召回率:90%)
  2. 未使用 FMA'22 AQB(召回率:78%)

如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。

请求您帮助了解这是否是目标泄漏的情况?

input statistics prediction feature-selection data-science-experience
1个回答
0
投票

您是否尝试过使用卡方计算特征相关性的热图,然后使用cramer's V。请仔细阅读并在删除一些高度相关的特征(>.30)后尝试训练。

© www.soinside.com 2019 - 2024. All rights reserved.