k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

将客户打包成桶

我说有25个客户。每个客户都有我们系统的许多用户,例如客户1有45个用户,客户2有46个用户...客户25有1000个用户。我想将每个客户分成一个......

回答 2 投票 2

在不知道k的情况下,哪种聚类算法适用于一维列表?

我有一个像这个公共类的一维列表Zeit_und_Eigenschaft {[Feature] public double Sekunden {get;组; }} // ...列表 lzue =新名单

回答 2 投票 2

在python中使用K-means聚类从简单的CAPTCHA进行字母分割[关闭]

上下文:我正在尝试使用python3学习机器学习。我的目标是创建一个CNN程序,可以猜出简单的4个字母72 * 24像素的CAPTCHA图像,如下所示:CAPTCHA Image Showing ...

回答 1 投票 -2

K表示聚类不平衡数据

我有一组包含50个特征(c1,c2,c3 ......)的数据,行数超过80k。每行包含标准化数值(范围0-1)。它实际上是一个标准化的虚拟变量,有些行...

回答 1 投票 -1

在相同配置下执行Spark应用程序时,任务,阶段和作业的数量是否有所不同?

我目前正在集群中执行K-Means算法。在相同配置下的连续执行(相同数量的执行程序,RAM,迭代,数据集)任务数量,......

回答 1 投票 1

Scikit-learn:如何在一维数组上运行K Means?

我有一个介于0和1之间的13.876(13,876)值的数组。我想将sklearn.cluster.KMeans仅应用于此向量,以查找值被分组的不同群集。但是,它......

回答 2 投票 15

我可以拥有500到2000范围内的集群,同时构建无监督分类的集群

我的数据集大小为1,00,000个条目。每个条目都提供了衬衫尺寸,衬衫价格和位置的详细信息。我想按衬衫品牌对这些数据进行分类..从数据集的来源我知道有......

回答 1 投票 0

使用数据框从K-Means集群中获取值

我有这个数据框(text_df):有10个不同的作者有13834行文本。然后我创建了一个单词并使用了像这样的TfidfVectorizer:来自sklearn.feature_extraction.text ...

回答 1 投票 0

K均值中的Spark ML-预测

我使用Spark ML方法创建了一个KMeans模型。 val kmeans = new KMeans()val model = kmeans.fit(df)我准备好了我的模型。但是如何预测哪个群集中的新数据点会下降。 ...

回答 1 投票 -1

评估k均值聚类

我正在做一个关于Twitter用户情绪分析的项目。我正在使用K-Means算法将推文聚类成3个集群,正,负和中性。但我仍然对...感到困惑

回答 1 投票 0

在二级MATLAB的pca上设计新点

我正在尝试使用PCA来可视化我的k-means算法的实现。我正在关注此链接中的主要组件系数,分数和方差的教程。我正在使用......

回答 1 投票 1

为k-means聚类准备点击流

我是机器学习算法的新手,我正在尝试根据新闻网站的用户点击流进行用户细分。我准备了点击流,以便我知道哪个用户ID读取...

回答 2 投票 0

K Means智能家居数据挖掘人类活动模式的算法

我正致力于数据挖掘项目,以从智能仪表数据中挖掘人类活动模式。我无法找到KMeans的解决方案或如何使用KMeans算法进行群集。数据就像......

回答 1 投票 0

R中的Kmeans:比不同的数据点更多的聚类中心

在R中使用kmeans导致以下问题:kmeans中的错误(smpl $ LOAN_AMOUNT,centers = 10):比不同的数据点更多的集群中心。我提供了主要数据集的样本......

回答 1 投票 -1

如何找到k-means簇的数量区间?

我正在尝试使用Kmeans对数值变量进行离散化。它工作得很好,但我想知道如何在群集中找到间隔。我和FactoMineR合作做我的kmeans。我发现3 ...

回答 1 投票 0

在R中输入k-means

我正在尝试在69列和1000行的数据帧上执行k-means。首先,我需要首先使用Davies-Bouldin指数来确定最佳簇数。这个算法......

回答 1 投票 0

在R中设置kmeans的静态中心

我想根据预先确定的中心点(my_center_Points)对Long和Lats(my_long_lats)列表进行分组。我跑的时候: - k

回答 2 投票 1

k表示分组数据中的聚类

目前,我尝试在分组数据中找到群集的中心。通过使用示例数据集和问题定义,我能够创建包含每个组的kmeans集群。但是当谈到......

回答 1 投票 4

当您拥有未知数据时,计算质心的标准方法是什么?

我必须计算用户评级的质心。我的数据存储在看起来像这样一个矩阵(想象一下,我们有4个用户和12条):[0,1,0,-1,0,2,3,4,1,0,0,0] [0,1,1,-1,0,2,3,4,1,0,2,0],[...

回答 1 投票 0

使用k-means聚类基于单个变量进行聚类

我只是试图让我的头围绕聚类。我有一系列数据点 - y - 它们具有与之相关的噪声函数(高斯)有两类值0和> 0(...

回答 3 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.