我有一个数据集,目标列中有多个值。我正在解决的问题是金融(贷款)欺诈检测问题,我试图识别潜在的违约者。 我还没有遇到目标列有多个值的问题。通常,其零和一位于目标列中。我是否继续执行正常的预测过程,还是将 > 0 的值转换为 1,以便我的多值列变为二进制?.
您所描述的称为one-hot编码。还有其他几种编码技术,请查看此链接:https://www.kaggle.com/code/arashnic/an-overview-of-categorical-encoding-methods