计算R中矢量的基尼杂质

问题描述 投票:0回答:1

我正在研究R中的一个问题,并尝试将Gini索引计算为二元分类问题的一部分,最初是针对所有值都不同的向量。我有点困惑,因为我希望得到1的完美平均值的结果,但是使用Gini函数我会得到不同的结果,例如Gini()库中的DescTools函数:

samplevector <- c(0:20)
Gini(samplevector)
[1] 0.3666667

我在这里错过了什么?

r classification
1个回答
0
投票

你错过了Gini索引计算的内容。在您的示例中,您提供的收入向量在基尼系数指数意义上并非完全不相等。如果您希望索引为1:

samplevector <- c(rep(0,100),100)
Gini(samplevector)

[1] 1

在这里,qazxsw poi是一种完全不平等的收入分配:某人拥有一切,所有其他人都没有。相反的:

samplevector

在这里,每个人都有相同的收入,你得到的基尼指数几乎为0.在你的例子中,你有一个中间情况。

© www.soinside.com 2019 - 2024. All rights reserved.