k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

绘制K-Means聚类后的聚类图。

我在一个数据集上使用了K-Means聚类,我发现了7个聚类,但我无法绘制聚类。请看下面我使用的代码:- # 绘制聚类数据 fig, ax = plt......

回答 1 投票 0

文件的聚类与它的结构。

我的工作是通过观察文档的结构来进行聚类。到目前为止,我所做的。在下面的代码中提取了嵌入(Bert embeddings)中的结构变量X。我所...

回答 2 投票 2

基于Python中的空间聚类方法填补缺失值

给定一个数据框如下: 纬度 经度 用户服务 0 -27.496404 153.014353 02:杜希格塔 1 -27.497107 153.014836 NaN 2 -27.497118 153.014890......

回答 1 投票 0

k-means中心点标签在同一程序的不同运行中会发生变化?

我观察到,尽管原始特征是相同的,但同一程序的后续运行为k-means聚类提供了不同的标签。该程序将一组变换应用于 ...

回答 1 投票 0


处理K中的ID号意味着聚类

我是机器学习的新手。我想知道当有大量的分类数据时,如何处理它们。例如,我有一个客户ID的特征(例如-255458565),有一个近 ...

回答 1 投票 0

使用不同的颜色和标签进行聚类

我正在研究文本聚类。我需要用不同的颜色来绘制数据,我使用了kmeans方法进行聚类,tf-idf进行相似度分析。Kmeans_labels =KMeans(n_clusters=3).fit(...)。

回答 1 投票 0

使用TF-IDF在K-Means中绘制中心点。

我正在用KMeans编码来组文本,一切都很好,但我无法将中心点绘制在一起。我不知道如何使用matplotlib,只知道seaborn连同创建的向量 ...

回答 1 投票 0

为什么NMI值较小,而聚类中的聚类精度和兰德指数较高?

我使用https:/www.mathworks.commatlabcentralfileexchange32197-clustering-results-measurement 在MATLAB中评估我的聚类精度,它提供了精度和rand_index,...

回答 1 投票 0

从K-Means(Voronoi单元)中获得决策的边界。

我有一个K-means的实现,它返回聚类。所说的聚类是要将一个城市进行苔化。我感兴趣的是得到每个簇的边界,即voronoi单元。我的代码是...

回答 1 投票 0

在PyPI的pyclustering库中的kmedoids的n-iter?

对于PyPI中的pyclustering库中实现的kmedoids,我如何才能访问直到收敛为止的迭代次数的属性?在Scikit Learn实现的......

回答 1 投票 0

如何在sklearn新版kmeans中使用预计算的距离矩阵?

我正在计算我自己的距离矩阵,如下所示,我想用它来进行聚类。 import numpy as np from math import pi #points containing time value in minutes points = [100, 200, 600, 659, ...

回答 1 投票 0

多变量正态分布的聚类分析

我有 N 个多变量正态分布。我想对它们进行聚类,以便去除多余的分布(那些彼此足够接近的分布),或者通过增加它们的sigmas来合并它们。是...

回答 1 投票 1

如何决定随机_状态值和类标签的最佳搭配?

在过去的几天里,我试图使用SciKit Learn实现KMeans算法,但我遇到了一个非常困惑的问题。我有一个数据集,它有两个类标签['ALL', 'AML'],其中 ...

回答 1 投票 1

聚类。如果因素不独立是否有问题? 如何评估模型?

我的数据如下:每个观测值是一个人,变量是在清晨、清晨晚些时候、下午、傍晚和晚上(5个变量)做某项活动所花费的时间(以分钟为单位)......。

回答 1 投票 1

"sklearn.cluster.k_means "和 "sklearn.cluster.KMeans "之间的区别是什么,我应该使用其中一个吗?

我对 "sklearn.cluster.k_means "和 "sklearn.cluster.KMeans "之间的区别感到困惑,我应该使用其中之一吗?

回答 1 投票 2

K-means如何确定特定经纬度附近的大部分位置。

我知道一个城市中每个街区的中心经纬度,我有一组餐厅的数据,有它们的经纬度。我需要确定哪个街区是最 ...

回答 1 投票 0

`kml`包中的图形窗口不能正常工作。

我开始使用软件包kml来进行纵向聚类分析。该软件包声称有一个交互式图形窗口,让你探索kml发现的聚类。这个...

回答 1 投票 0

Python - 根据关键字将列表分割成多个列表。

我有这个巨大的python列表,我得到了一个K手段聚类算法的输出。clusterlist = [] for i in range(true_k): clusterlist.append('\nCluster %d:' % i), for ind in ...。

回答 1 投票 0

如何在R中检索每个客户所属的群集号和中心点。

我有一个超过20000行的数据集,其中每行是一个独特的客户。我做了k-均值聚类,输出是这样的。 str(km.out.best) List of 9 $ cluster : Named int [1:24] 2 1 1 3 4 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.