我如何找出有损失的样本数量>中位数损失；和使用R

问题描述投票：0回答：1

我如何找出损失的样本数>损失中位数；使用R中的分层聚类，有多少损失我正在使用数据集Allstate声明的严重性，我认为数值属性已规范化，其值在0到1之间]

这是我的代码：

claims<-read.csv("train.csv")
idx<-sample(1:dim(claims)[1],10000) #10000 random samples
claimsSample<-claims[idx,118:131] #retrieve the numeric features
distances<-dist(claimsSample,method="euclidean")
clusterClaims<-hclust(distances, method = "ward.D")
plot(clusterClaims)
clusterGroups<- cutree(clusterClaims,k=9)
所以，我如何找到中位数和样本？

我如何找出损失的样本数>损失中位数；以及使用R中的层次聚类造成的损失。我正在使用数据集Allstate声明严重性，我认为数字...

r cluster-analysis hierarchical-clustering

1个回答

1
投票

您实际上应该提供示例数据集，或将其他SO用户定向到感兴趣的数据集。 “损失”可能意味着很多事情...

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.