解读 WEKA 数据

问题描述 投票:0回答:1

我有一个 CSV 文件,其中包含大约 10,000 个条目。 CSV 文件包含有关在特定酒店预订假期的个人的数据。 CSV 文件包含以下列

1:country_origin(作为名义变量) 2:month_booking(作为名义变量) 3:is_cancelled(作为二进制变量)

我正在尝试使用 WEKA 来确定哪些国家/地区与取消频率最高相关。

我不太确定如何去做这件事 - 我考虑使用树(J48)分类器,但我不太明白结果意味着什么,所以我无法解释它们是否正确。


这就是我所做的

  1. 在 WEKA 中打开文件
  2. 经过预处理以确保所有数据均为标称数据,以便 J48 可以使用
  3. 选择 J48 分类器并使用交叉验证折叠 = 10。选择我的课程为“is_cancelled”。

然后我得到了如下所示的输出(非详尽)。这是什么意思?

weka
1个回答
0
投票
© www.soinside.com 2019 - 2024. All rights reserved.