k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

剪影方法:随着K的增加,分数总体上增加

[与在线教程不同,轮廓图具有全局最大值。我的情节总体上随着K数的增加而增加。但是我可以找到局部最大值。我应该那样做吗?我也用过...

回答 1 投票 0

k均值总是收敛的证明?

我了解k均值算法的步骤。但是我不确定算法是否会一直收敛?还是观察总是可以从一个质心切换到另一个质心?

回答 2 投票 7

Python-Kmeans-将质心添加为新列

假设我有以下数据框。如何创建包含质心的新列“ new_col”?我只能使用实验室创建列,而不能使用形心创建列。这是我的代码。来自...

回答 1 投票 0

是否有一种方法可以通过R中的K均值内的变量来计数/着色?

我已经在数据帧上部署了K-Means,我想看看每个集群中每个组有多少个。 train2

回答 2 投票 0

Python中Kmeans算法的限制

我有下一个代码,但是我不知道如何限制距离?例如,将半径2 km之内的那些分组。从sklearn.cluster导入从sklearn导入指标导入KMeans ...

回答 1 投票 0

Kmeans算法的训练在Spark上失败

我创建了一条管道,并尝试在Spark中训练Kmean聚类算法,但是它失败了,我无法找到确切的错误。这是代码导入org.apache.spark.ml。管道导入组织....

回答 1 投票 0

电子邮件分类中有word2vec和KMeans的问题(无论买方还是非买方)

该数据集包含大约1万封电子邮件文本。想法是将它们分为买方或非买方类别。买方电子邮件中的某些标准字词遵循以下模式:请求报价...

回答 1 投票 -1

根据数据将K均值标签从低到高排序

我有一个“压力”数据系列。我用scikit执行了3个聚类K均值。我需要为每个数据的簇分配标签的标签,从低到高排序,因此“低压”值具有...

回答 1 投票 0

输入包含NaN,无穷大或在执行KMean函数时对于dtype('float64')而言太大的值

我是数据科学领域的新手,在尝试进行KMeans聚类时,我遇到了此错误:输入包含NaN,无穷大或对于dtype('float64')而言太大的值。显然我的编码是...

回答 1 投票 0

如何使用KMeans绘制质心图

我正在使用数据集,并试图学习如何使用聚类分析和KMeans。我从散点图绘制2个属性开始,然后添加第三个属性,并尝试绘制一个...

回答 1 投票 0

如何绘制KMeans?

我正在尝试将MiniBatchKMeans与更大的数据集一起使用,并绘制2个不同的属性。我收到一个Keyerror:2我相信我在for循环中出错,但是我不确定在哪里。可以...

回答 1 投票 0

要使用python确定给定数据集的最佳k均值

我对python和杂乱无章的东西很陌生。现在,我的任务是分析一组数据,并使用弯头和轮廓法确定最佳Kmean。如图所示,我的...

回答 1 投票 0

如何测量R中的K均值聚类的性能? [包含图片和代码]

我目前正在对公司的一些客户数据进行K-means聚类分析。我想衡量这个集群的性能,我只是不知道用来衡量...

回答 1 投票 0

PCA后计算k均值

我是R的新手,我想根据pca的结果进行k均值聚类。我确实是这样的:#计算PCA res.pca

回答 1 投票 0

在进行kmeans聚类后找到特征重要性的python代码

我研究了找到特征重要性的方法(我的数据集只有9个特征)。以下是实现特征重要性的两种方法,但是我很难编写python代码。我正在寻找...

回答 1 投票 0

如何绘制kmeans?

[我正在使用数据集并尝试学习Kmeans聚类,正在使用以下代码:将numpy作为np导入,将pandas作为pd导入,将matplotlib.pyplot作为sklearn.cluster中的plt导入...

回答 1 投票 0

ValueError:未知标签类型:一起使用聚类+分类模型时为'连续'

我创建了一个聚类模型,以使用Scikit-Learn的KMeans算法根据年收入和支出得分来尝试寻找不同的客户群。使用它的簇值...

回答 1 投票 0

使用余弦相似性的K均值-Python

我正在尝试在python中实现Kmeans算法,该算法将使用余弦距离而不是欧式距离作为距离度量。我了解使用不同的距离函数可能是致命的...

回答 1 投票 12

带有pycluster的加权聚类

我设法采用一个代码段来说明如何使用PyCluster的k-means聚类算法。我希望能够加权数据点,但是不幸的是,我只能加权特征。我是...

回答 2 投票 4

哪个是用于以低密度差对多维数据进行聚类的最佳聚类算法?

我目前正在从事一个项目,希望对多维数据进行聚类。我尝试了K-Means聚类和DBSCAN聚类,两者都是完全不同的算法。 K均值模型...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.