如何将“询问年龄”作为回归的输入变量?

问题描述 投票:0回答:0

我正在尝试创建一个逻辑回归模型,该模型允许我为与高价值产品销售查询相关的几个分类变量赋予权重。同样的一个例子是度假租赁,预测是否会有购买,以便可以按照“后续电话”的顺序对查询进行排序,以尝试完成销售。假设在租赁示例中,变量是房间类型(大号床、特大号床、套房)、查询来源(电话、网络或应用程序)、客户状态(新买家与回头客)以及可能最有用的查询年龄几天之内。 80% 的销售额是在询价后 3 天内完成的,因此我们显然希望在此时间之前更重视询盘的权重,但我想将其放入回归中,以便在其他条件不变时获得真正的权重。

我最初只是假设在我的训练数据中我可以使用“购买天数”作为占位符,如 0、1、2、3 和 4+(或不购买)。很快意识到这没有意义,因为它与新传入查询的年龄不同,因此权重只会告诉您当天购买的对数几率,而不是查询年龄时的总购买潜力。有什么好的办法来处理这个问题吗?我在 R 中使用 glm()。我也对其他模型类型和方法持开放态度,但它不需要很花哨,只需防御性即可。

r classification logistic-regression ranking
© www.soinside.com 2019 - 2024. All rights reserved.