k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

如何使用Python使用K-Means将标签簇与真实标签进行匹配

我在使用 Kmeans 算法处理标签数据时遇到问题。我的测试句子得到了真实的聚类,但我没有得到真实的标签。我已经使用 numpy 将集群与 true_label 进行匹配...

回答 4 投票 0

使用 TSNE 和 Kmeans 进行无监督学习

我正在尝试对数据集进行无监督学习来进行特征提取,并找出哪组数据聚集在一起以及该组数据的主要特征(质心)是什么......

回答 1 投票 0

如何匹配k-means聚类中的标签及其聚类点?

我正在进行 k 均值聚类,我想确保标签与正确的聚类编号匹配。下面是我使用的代码 将 pandas 导入为 pd 将 numpy 导入为 np 导入 matplotlib....

回答 1 投票 0

按作者绘制颜色,但按 kmeans/tf-idf python 进行聚类

嘿嘿! 我第一次使用 k-means/tf-idf/document 集群。 我使用 k-means/tf-idf 对文本文件进行聚类,效果很好。我绘制了 (PCA) 并且可以很好地看到集群。 但现在我想要作者......

回答 1 投票 0

Python - 图像颜色外推 - KMeans 错误

我找到了这个教程,介绍如何编写一个 python 脚本,该脚本使用 OpenCV 和 Kmeans 从图像中推断出顶部颜色,并使用 Matplot 将它们绘制在饼图中。 代码如下...

回答 1 投票 0

在过滤后的 pandas 数据上使用 kmeans 时出现问题

我导入了一个 CSV 文件,并过滤了两列。非常标准并且按预期工作。然而,当我运行 KMeans 测试时,结果出乎意料。我要么在整个

回答 1 投票 0

Python scikit-learn 每次运行后聚类结果的变化

我有一堆句子,我想使用 scikit-learn 谱聚类对它们进行聚类。我已经运行了代码并得到了结果,没有问题。但是,每次运行都会得到不同的结果......

回答 5 投票 0

当我运行简单的集群模型时,Jupyter 笔记本内核崩溃了

我只是尝试运行一个简单的 KMeans 模型。我也逐行运行了代码。它总是在“安装步骤”上死掉。这个问题的原因可能是什么?谢谢! 将 numpy 导入为 np ...

回答 1 投票 0

使用sklearn KMeans而不进行拟合

与这里的问题类似,我想根据预先计算的质心对一些数据进行聚类。与该问题不同的是,这些质心是由其他方法提供的。 我可以计算一下

回答 1 投票 0

在 K 均值聚类肘部图中找到正确的值

使用 k 均值算法,我需要确定要作为输入传递的 k 值。为此,我决定使用肘部图来获得以下图表: 获得的惯性值是

回答 1 投票 0

sample.int(m, k) 中的错误:无法获取大于总体的样本

首先,我要说的是,我对机器学习、kmeans 和 r 相当陌生,这个项目是一种了解更多相关知识的方法,也是向我们的 CIO 展示这些数据的一种方法,这样我就可以在开发...

回答 2 投票 0

do_one(nmeth) 中的错误:使用 kmeans 时外部函数调用 (arg 1) 中的 NA/NaN/Inf

我尝试在r中使用kmeans进行聚类,但它给出了错误 do_one(nmeth) 中的错误:外部函数调用中的 NA/NaN/Inf (arg 1) 另外:警告消息: 在存储模式(x) <- "do...

回答 2 投票 0

R 中的 Kmeans 错误

我尝试在r中使用kmeans进行聚类,但它给出了错误 do_one(nmeth) 中的错误:外部函数调用中的 NA/NaN/Inf (arg 1) 另外:警告消息: 在存储模式(x) <- "doubl...

回答 2 投票 0

Python:加载 kmeans 训练数据集并使用它来预测新数据集

我有大量数据,我想对其运行 kmean 分类。数据集太大,我无法将文件加载到内存中。 我的想法是按一定标准进行分类...

回答 3 投票 0

基于有约束的空间坐标对人员进行聚类

我有一个 pandas 数据框 df。纬度和经度列代表人的空间坐标。 将 pandas 导入为 pd 数据 = { “纬度”:[49.5619579, 49.5619579, 49.

回答 1 投票 0

如何将住得很近(但不是太近)的人聚集在一起?

我有一个问题想了很久。这是关于人群聚集。 我拥有的: 我有一个 pandas 数据框,其中包含代表空间的纬度和经度列

回答 1 投票 0

计算pandas数据框中kmeans的损失函数

我有一个包含 5 列的数据框。我正在尝试对三个变量 X、Y 和 Z 的点进行聚类,并找到 kmeans 聚类的损失函数。下面的代码可以解决这个问题,但是...

回答 3 投票 0

什么才是好的剪影分数?

我目前正在做一些基于单词嵌入的聚类,并且我正在使用一些方法(elbow 和 David-Boulding)来确定我应该考虑的最佳聚类数量。另外,我

回答 1 投票 0

factoextra 包:如何使用变量轴而不是 PCA 分量轴绘制集群?

库(集群) 公里资源 <- kmeans(my_data, 4, nstart = 25) # Visualize library("factoextra") fviz_cluster(km.res, data = my_data, frame.type = "convex")+ theme_minimal() I w...

回答 1 投票 0

kmeans 散点图:为每个簇绘制不同的颜色

我正在尝试绘制 kmeans 输出的散点图,它将同一主题的句子聚集在一起。我面临的问题是绘制属于每个簇的特定颜色的点。

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.