k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

我应该将行业分类代码视为K-means聚类中的双数据类型吗?

由于K-means不能直接处理分类变量,我想知道将所有经济活动的国际标准行业分类或ISIC转换为双重...

回答 3 投票 -1

使用numpy在python中重构K-means算法

我正在研究python中的K-means算法并且以直观的方式完成了这个代码,并且想要优化和重构它。对于范围内的i(N):对于范围内的j(K):...

回答 1 投票 0

mutate / tibble中的自定义函数

我正在关注一个教程,我正在尝试将此部分应用于我的数据/问题kclusts%mutate(kclust = map(k,~kmeans(points,.x)),tidied = map(kclust,tidy),...

回答 1 投票 2

R中的聚类分析:确定最佳聚类数

作为R的新手,我不太确定如何选择最佳数量的聚类来进行k均值分析。绘制下面数据的子集后,适合多少个群集?我怎么能够 ...

回答 7 投票 409

如何使用PAM数据定义fviz_cluster中的维度?

我有一个数据框,分为行中的样本和列中的变量。执行PCA时:df.pca

回答 1 投票 0

使用Q Methodology数组来聚类调查数据

我有来自Q Methodology学生的因子数组,我有一个400多名参与者的调查。我在每项研究中使用了相同的42条意见陈述。在Q研究中,所有42个陈述都排在......

回答 1 投票 0

scikit-learn会利用GPU吗?

在tensroflow中阅读scikit-learn的实现:http://learningtensorflow.com/lesson6/和scikit-learn:http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html我是...

回答 2 投票 25

如何使用matplotlib绘制由KMeans生成的集群?

我使用KMeans进行聚类,如下所示,但我不知道在散点图中绘制我的聚类。或者喜欢这个情节我的代码是:来自sklearn.feature_extraction.text import TfidfVectorizer ...

回答 1 投票 -1

K均值聚类R树增强

我正在使用R-Tree boost。我在r-tree boost中增加了十万点。现在我想像这个链接一样对我的点进行聚类和分组。似乎我应该从点计算k均值。怎么样 ...

回答 1 投票 0

R中的聚类分析:K-means中的弯头方法

我正在使用R包fviz_nbclust将elbow方法实现到我的数据集。该方法将通过从1 ... k变化K来计算每个簇的总和平方内的总和。例如......

回答 1 投票 0

为什么K-means聚类的分类准确性随着训练数据的增加而降低?

我想对视频中的动作进行分类。为此,将K均值聚类应用于光流点以生成码本。当k = 200时,精度最初为85%。加入培训后......

回答 1 投票 -2

计算数据点集群的标准偏差

所以,我有一个数据点列表,其中所有数据点都属于一个集群(每个项目是一个numpy数组,有3个功能(重新点一个点))。我计算它们的质心(点的平均值)。我想要 ...

回答 1 投票 -1

将GPS数据聚类为“k”组

我有一个GPS(经度和纬度对)数据列表(~3000),我想根据它们的距离(测地线和/或欧几里德)将它们分成“k”组。最好的方法是什么?

回答 1 投票 -2

根据最小距离将点分配给组

我试图根据欧几里德距离将分数分配到分组中。例如,在下面的数据中,有三个点代表三个不同的组(一,二,三,非绿...

回答 1 投票 0

生成具有最大距离的随机集群中心

我有一个序列数据(每次一个实例)聚集成两个类。我想使用顺序版本的K-means(顺序K-means)来完成这项任务。随机指定......

回答 1 投票 1

无监督学习

我正在研究最后一年的项目,该项目必须使用无监督学习(KMeans算法)进行编码。它是从各种游戏中预测关于其认知技能水平的合适游戏。 ...

回答 1 投票 -3

matlab中的k-means算法给出了错误的答案?

我有以下疑问:我正在使用Matlab的k-means函数,我只想使用vanilla Lloyd的算法,以及我想要的一组初始化点。我使用以下代码,...

回答 1 投票 0

如何在Spark中选择kMean集群作为新的Dataframe

我有一个包含几百万个条目的数据框,我使用了k-Means聚类,发现一个特定的集群与其他集群有着截然不同的中心。这很有趣。我怎样才能选择......

回答 1 投票 0

如何在Python中绘制具有多个维度的大型数据集?

我正在尝试从K Means方法绘制聚类,而数据集包含一百万个具有60个维度的记录。为了获得95%的差异,我通过PCA将维数降低到35个组件......

回答 1 投票 0

K-Means距离测量 - 大数据和混合尺度

我有一个关于k-means聚类的问题。我们有一个包含120,000个观测值的数据集,需要用R计算k均值聚类解。问题是k-means通常使用欧几里德...

回答 4 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.