我如何找出损失的样本数>损失中位数;使用R中的分层聚类,有多少损失我正在使用数据集Allstate声明的严重性,我认为数值属性已规范化,其值在0到1之间]
这是我的代码:
claims<-read.csv("train.csv") idx<-sample(1:dim(claims)[1],10000) #10000 random samples claimsSample<-claims[idx,118:131] #retrieve the numeric features distances<-dist(claimsSample,method="euclidean") clusterClaims<-hclust(distances, method = "ward.D") plot(clusterClaims) clusterGroups<- cutree(clusterClaims,k=9)
所以,我如何找到中位数和样本?
我如何找出损失的样本数>损失中位数;以及使用R中的层次聚类造成的损失。我正在使用数据集Allstate声明严重性,我认为数字...
您实际上应该提供示例数据集,或将其他SO用户定向到感兴趣的数据集。 “损失”可能意味着很多事情...