我如何找出有损失的样本数量>中位数损失;和使用R

问题描述 投票:0回答:1

我如何找出损失的样本数>损失中位数;使用R中的分层聚类,有多少损失我正在使用数据集Allstate声明的严重性,我认为数值属性已规范化,其值在0到1之间]

这是我的代码:

claims<-read.csv("train.csv")
idx<-sample(1:dim(claims)[1],10000) #10000 random samples
claimsSample<-claims[idx,118:131] #retrieve the numeric features
distances<-dist(claimsSample,method="euclidean")
clusterClaims<-hclust(distances, method = "ward.D")
plot(clusterClaims)
clusterGroups<- cutree(clusterClaims,k=9)

所以,我如何找到中位数和样本?

我如何找出损失的样本数>损失中位数;以及使用R中的层次聚类造成的损失。我正在使用数据集Allstate声明严重性,我认为数字...

r cluster-analysis hierarchical-clustering
1个回答
1
投票

您实际上应该提供示例数据集,或将其他SO用户定向到感兴趣的数据集。 “损失”可能意味着很多事情...

© www.soinside.com 2019 - 2024. All rights reserved.