使用J48为x级别的感兴趣的划分属性解释结果(WEKA)

问题描述 投票:0回答:1

我是数据挖掘和Weka的新手。我使用GUI在Weka中使用J48构建了一个分类器,其中J48(训练集)用于五个级别的感兴趣属性。我必须评估模型的精度,但我不知道该怎么做!有些信息可能会引起关注:

== Detailed Accuracy By Class ===
Precision
0.80
?
0.67
0.56
?
?

首先,我想知道“?”的含义在精密列中。当用两个级别的感兴趣属性进行探测时,我得不到“?”。树现在比分成两个级别时更大。我在质疑这是否意味着在五个级别中获取感兴趣的属性可能会在分类和计算时间方面产生效率较低的树。这似乎非常明显,因为当属性有2个级别时,正确分类实例的数量高达72%。

提前谢谢,所有有趣的答案都会得到回报!

weka j48
1个回答
1
投票

“我想知道精密列中”?“的含义”

请注意,对于这些相同的类,TP和FP速率为0.看来J48没有将任何观察结果分配给这些类。

这些课程相对较小吗?如果是这样,您可能需要考虑使用ClassBalancer过滤器。这将使用权重使所有类看起来大小相同。

当然,在获得模型后,您需要“转换回”真实情况。这与校正物理过采样或欠采样类似。在这里看到我的答案:https://stats.stackexchange.com/questions/211174/how-to-exact-prediction-from-over-sampled-dataundoing-oversampling/257507#257507

© www.soinside.com 2019 - 2024. All rights reserved.