SAS Enterprise Miner 中的数据不平衡

问题描述 投票:0回答:1

我正在从事与安然电子邮件数据集相关的文本挖掘项目。目标是创建用于预测目标变量(标签)的最佳模型。目标是二元的,0 表示非欺诈,1 表示欺诈。目前数据大约有 420,000 个 0 和 2000 个 1,因此我们所有的模型都具有很高的准确性。我相信它将 1 条记录视为错误。我该如何在 Enterprise Miner 中解决这个问题?

我运行了我的模型,没有重新采样或创建不平衡程度较小的集合。准确率很高。

sas enterprise-miner
1个回答
0
投票

对于罕见事件,您可以在数据源本身或使用决策节点调整决策权重 - 两者都可以。我更喜欢在数据源本身上执行此操作。为此,请选择您的数据并单击屏幕左侧面板上的决策省略号。有关如何解决这种情况的一个很好的示例可以在文档中找到:决策节点示例

作为调整权重的示例,我们将使用 sashelp.class:

  1. 将数据添加到图表中,然后在数据的属性面板中选择决策省略号:

  1. 建立您的目标档案:

  1. 转到“决策”选项卡,单击“默认使用逆先验权重”,并确保“您想使用决策吗?”设置为“是”

  1. 转到“决策权重”选项卡并验证值,将决策函数保留为“最大化”,然后单击“确定”

  1. 分区和模型正常
© www.soinside.com 2019 - 2024. All rights reserved.