k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

如何使用python绘制散点图?

我已经使用此代码创建了集群,我想绘制集群的散点图。 vectorAssembles_01产生具有ID和特征的数据。两者都应用于绘制散点图。...

回答 1 投票 1

使用sklearn_pandas查找k均值聚类的最重要单词

我是sklearn的新手。我希望我的代码根据文本列和一些其他类别变量对数据进行k-均值聚类。 CountVectorizer将文本转换为单词袋,然后...

回答 1 投票 0

如何将无效索引固定为标量变量?

[我试图编写K-means算法,并在行中得到此错误:points = np.array(如果簇[j] == i],[x [j]表示范围在j(len(x))的j),任何人都可以帮帮我?从副本导入deepcopy def ...

回答 1 投票 0

如何根据属性数量动态创建字典?

我有一个CSV文件,该文件具有6个属性和1个类,可以通过Pandas进行阅读。 CsvFile =“ /path/to/file.csv” df = pd.read_csv(CsvFile)我的CSV文件的前5行:x,y,x1,y1,x2,y2,class 92,115,120,94,84,102,...] >

回答 2 投票 1

如何根据属性数量动态创建Python字典

我有一个CSV文件,该文件具有6个属性和1个类,可以通过Pandas进行阅读。 CsvFile =“ /path/to/file.csv” df = pd.read_csv(CsvFile)我的CSV文件的前5行:x,y,x1,y1,x2,y2,class 92,115,120,94,84,102,...] >

回答 1 投票 0

K均值聚类超参数调整

我正在尝试通过在带有决策树分类器的管道中使用时空K均值聚类来执行超参数调整。这个想法是使用K-Means聚类算法来...

回答 1 投票 0

超参数调整k均值聚类

我正在尝试通过在带有决策树分类器的管道中使用时空K均值聚类来执行超参数调整。这个想法是使用K-Means聚类算法来...

回答 1 投票 0

如何使用SKlearn KMeans模型编码未来数据

我使用KMeans识别集群并将每个数据行分配给其中一个集群。这对于我目前正在使用的数据非常有用。假设我要编码一个新的数据集以符合...

回答 1 投票 1

数据点与其簇中心的平均偏差随每次迭代而变化

我的数据集可以在kaggle https://www.kaggle.com/vjchoudhary7/customer-segmentation-tutorial-in-python中找到。因此,我在具有4个collum和200行且k = 5的数据集上运行k-means。I ...

回答 1 投票 0

如何计算数组中每对点之间的总欧几里得距离

我有一个类似于以下的数组:array([[-1.53 172534,0.47023084,[-1.45365077,0.47860466],[-1.77932397,0.63310581],...,[-1.30975015,1.29030593],[-0。 ..

回答 1 投票 0

Java:针对字符串的k均值的实现,并探讨了选择最佳k的方法

例如,我想使用Java(Netbeans)实现K-means算法来聚类字符串数据类型(Names):如果之后有{apple,app,jara,java,appia,jaoa ...}之类的数据, ...

回答 1 投票 0

在K均值聚类后使用散点图绘制聚类

我已经在数据集上使用了K均值聚类,但是我发现了7个聚类,但是无法绘制聚类。请在下面找到我使用的代码:-#绘制集群数据图,ax = plt...。

回答 1 投票 0

R-组内的聚类(K均值)

我需要帮助将我的数据聚集到指定的组中...我有以下数据框:#生成数据框set.seed(1)df1

回答 1 投票 0

当我们混合数据时如何用K-means聚类方法处理分类数据?

我正在使用k均值方法根据建筑物的能耗,面积(以平方米为单位)和所在位置的气候带对它们进行聚类。气候区是一个类别变量。值可以是A,B,C ...

回答 3 投票 -1

所有中心都在K均值聚类上重合

我正在尝试通过以下Python代码段应用K-Means。基本上,arr是一个具有三列值的numpy数组(我要集群的具有多个功能的数据)。在这里,...

回答 1 投票 4


无论簇中心如何初始化,均可以保证Kmeans算法收敛?为什么?

K-均值是一种迭代算法,可随机初始化聚类中心。无论簇中心如何初始化,均可以保证Kmeans算法收敛吗?为什么?

回答 1 投票 0

是否有关于肘法中k值的最佳范围的研究?

我的主要问题是以某种方式定位k值的范围以执行弯头分析。目前,我只能想到2到min(num_rows,num_columns)之间的范围。还有其他...

回答 1 投票 0

在k中找到最接近的质心表示聚类

X = [1.8421 4.6076; 5.6586 4.8; 6.3526 3.2909; 2.904 4.6122; 3.232 4.9399; 1.2479 4.9327]而质心= [3 3; 6 2; 8 5]我正在尝试...

回答 1 投票 0


© www.soinside.com 2019 - 2024. All rights reserved.