为什么在我的weka输出中得到浮点值？

Question

我正在数据集上运行J48算法，并且在输出中得到如下所示：

J48 pruned tree
------------------

attribute1 = n: class1 (253.41/3.75)
attribute1 = y
|   attribute2 = n: class2 (145.71/4.0)
|   attribute2 = n: class1 (40.68/3.0)

我想知道括号中的内容是什么意思。我在某处读到，由于该选择，第一个值是正确分类的实例，第二个是多少错误。但是，这怎么可能是一个十进制数字？如何正确分类0.41？

Answer 1

我在这里找到答案：http://weka.wikispaces.com/What+do+those+numbers+mean+in+a+J48+tree%3F

基本上，它会将缺少值的实例分割开来，并将其视为所有树中的分数实例。

Answer 2

对于示例数据集：https://www.cs.vassar.edu/~cs366/data/weka_files/vote.arffWeka的Vote.arff

决策树结果：医师费冻结= n：民主党人（253.41 / 3.75）。

第一个数字表示到达该节点的正确事物的数量。（在该民主人士中），“ /”之后的第二个数字表示到达该节点的不正确物体的数量（在这种情况下为共和党人）

实例总数：435没有的总数（也是正确的东西的整数）：253没有的概率：253/435 = 0.58

丢失的数据总数：11出现“否”的总次数：8概率：8/11 = 0.72

丢失的数据可能为空的总概率：0.58 X 0.72 = 0.42

正确的总数：253 + 0.42 = 253.42〜253.41

“ /”后面的数字表示到达该节点的不正确物体的数量。现在，如果您看到此数据，则有五个不正确的情况，其中结果是“共和党”，而“医师冻结费”是“ n”（或“？”）]

这五个可以分为以下几类：“ n”个不正确实例总数：2带有“？”的不正确实例总数：3

类似公式：

2+（253/435）* 3 = 3.75

为什么在我的weka输出中得到浮点值？

问题描述投票：0回答：2

2个回答

最新问题

为什么在我的weka输出中得到浮点值？

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2