k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

如何从图像中提取特定颜色

我需要一些支持来向我的代码添加详细信息。在我的代码中,我仅使用 1 张图像(请参阅附件,称为“Photo1”)。 当我运行整个代码时,它将给出以下输出: ,...

回答 1 投票 0

是否可以预先指定一个聚类结构,然后根据R中常见的聚类标准进行合并?

假设我有一个数据集,我在其中进行了聚类分析,例如 k=9。也许这是来自 k-means,或者我刚刚完成了完整的链接分层聚合,或者我注视着我......

回答 1 投票 0

如何按长向量列对数据框进行聚类

我有一个数据框,其中有一个名为“address”的列和一个名为“vecor”的列,其中向量的长度为 700。我想按向量列对数据框进行聚类,但是当我尝试使用 KMeans 算法时...

回答 1 投票 0

如何在另一个表中显示每个簇中“kondisi”列有多少个值 1,2,3?

此图像是数据集的示例 所以我向 ChatGPT 和另一个 AI 助手询问了这个问题,但结果是 0。 这张图片是显示我想要的内容的表格 因此,从有关表格的图像中可以看出我的意思

回答 1 投票 0

加入 scikit-learn KMeans 替代 GPU

我想知道什么是 from sklearn.cluster import KMeans 的良好替代品。网上其他人建议使用 Nvidia 的 RAPIDS 包中的 cuML,但这无法编译或者我...

回答 1 投票 0

python 中的 kmeans 聚类将数据垂直而不是水平分组

我有一个这样的数据集: 耦合系列 = [(9.752, 0.0005), (9.9792, 0.0008), (9.8571, 0.0036), (10.5017, 0.0038), (10.4808, 0.0038), (10.6975, 0.003), (12.1378, 0.0 008), (12.7328, 0.0005) , (14....

回答 1 投票 0

k-means聚类算法的实现

在我的程序中,我对 k-mean 算法采用 k=2,即我只需要 2 个簇。 我已经以非常简单直接的方式实现了,但我仍然无法理解为什么我的程序变得......

回答 5 投票 0

将 K 均值散点图与地面实况散点图进行比较

我有一个包含 x 和 y 变量的数据集。还有一个 z 列,指定 x 和 y 属于哪个组。有11组。我已经使用 K 均值聚类来创建一台机器,该机器将...

回答 1 投票 0

Kmeans 在 scikit 上的聚类时间

使用 k-means 和 200 个聚类对一组 100'000 个 L2 归一化 2048 维特征向量进行聚类需要多长时间?我的所有数据都在一个巨大的 numpy 数组中,也许有更合适的...

回答 2 投票 0

如何从该图中使用AIC和BIC方法在K均值聚类中选择K?

我必须通过使用 AIC 和 BIC 评分方法来确定 k 来确定 Mall_Customers.csv 中的组,有 2 个变量是支出分数 (1-100) 和年收入 (k$) 在此处输入图像描述 我想要一个

回答 1 投票 0

看到错误:“numpy.ndarray”对象没有属性“map”

我正在从较大的数据框中选择数据子集。 数据集 = df.select('RatingScore', '类别分数', '优惠券宾', 'TTM', '价格', ...

回答 1 投票 0

我可以仅基于一个变量(在 R 中)进行 K 均值聚类分析吗?

我有一个包含 2 列的数据框。第一列有气象站名称,另一列有相应的索引。我可以进行 K 均值聚类分析来对

回答 1 投票 0

在 Python 和 NumPy 中量化正态分布浮点数

让数组A中的值从高斯采样 分配。我想用 n_R 之一替换 A 中的每个值 R 中的“代表”,使得总量化误差为

回答 2 投票 0

严重不平衡/倾斜的数据集群

我在 Alteryx 上的 k 均值聚类结果面临一些问题。我正在尝试对大约 5000 个文本描述的数据集进行主题建模。数据清理、解析、删除后...

回答 1 投票 0

在大型基因数据集上实施 K 均值

我正在开发一个项目,需要使用 PySpark 对大规模数据集执行 K 均值聚类。该数据集由数百万行组成,并具有数千个特征列。我有

回答 1 投票 0

版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同集群结果

我正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在将 scikit-learn 从版本 0.22.2 更新到版本之后...

回答 0 投票 0

Kmeans:两个版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同聚类结果

我目前正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在从 0.22 版本更新 scikit-learn 后...

回答 0 投票 0

如何设置我的数据,以便第一行在我的数据框中像这样被封锁?

“锁定”行的图像 如何格式化我的数据框以匹配“wine”数据库与第一行的名称与其余数据分开? 我正在移动这些数据...

回答 1 投票 0

Python K-Means 算法不能正常工作

我正在尝试开发一种用于生物信息学的 K-Means 算法,到目前为止我设法开发了一个但它没有任何 k 参数,我将 k 值设置为 2。这段代码工作正常但现在我没...

回答 0 投票 0

将距离矩阵传递给 sklearn 的 K 均值聚类

我目前正在使用 ASJP 数据库进行研究,我有一个 30 种语言之间相似性的距离矩阵,形状为 (30 x 30)。我想在...上执行 K-Means 聚类

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.