在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。
我说有25个客户。每个客户都有我们系统的许多用户,例如客户1有45个用户,客户2有46个用户...客户25有1000个用户。我想将每个客户分成一个......
我有一个像这个公共类的一维列表Zeit_und_Eigenschaft {[Feature] public double Sekunden {get;组; }} // ...列表 lzue =新名单
在python中使用K-means聚类从简单的CAPTCHA进行字母分割[关闭]
上下文:我正在尝试使用python3学习机器学习。我的目标是创建一个CNN程序,可以猜出简单的4个字母72 * 24像素的CAPTCHA图像,如下所示:CAPTCHA Image Showing ...
我有一组包含50个特征(c1,c2,c3 ......)的数据,行数超过80k。每行包含标准化数值(范围0-1)。它实际上是一个标准化的虚拟变量,有些行...
在相同配置下执行Spark应用程序时,任务,阶段和作业的数量是否有所不同?
我目前正在集群中执行K-Means算法。在相同配置下的连续执行(相同数量的执行程序,RAM,迭代,数据集)任务数量,......
Scikit-learn:如何在一维数组上运行K Means?
我有一个介于0和1之间的13.876(13,876)值的数组。我想将sklearn.cluster.KMeans仅应用于此向量,以查找值被分组的不同群集。但是,它......
我可以拥有500到2000范围内的集群,同时构建无监督分类的集群
我的数据集大小为1,00,000个条目。每个条目都提供了衬衫尺寸,衬衫价格和位置的详细信息。我想按衬衫品牌对这些数据进行分类..从数据集的来源我知道有......
我有这个数据框(text_df):有10个不同的作者有13834行文本。然后我创建了一个单词并使用了像这样的TfidfVectorizer:来自sklearn.feature_extraction.text ...
我使用Spark ML方法创建了一个KMeans模型。 val kmeans = new KMeans()val model = kmeans.fit(df)我准备好了我的模型。但是如何预测哪个群集中的新数据点会下降。 ...
我正在做一个关于Twitter用户情绪分析的项目。我正在使用K-Means算法将推文聚类成3个集群,正,负和中性。但我仍然对...感到困惑
我正在尝试使用PCA来可视化我的k-means算法的实现。我正在关注此链接中的主要组件系数,分数和方差的教程。我正在使用......
我是机器学习算法的新手,我正在尝试根据新闻网站的用户点击流进行用户细分。我准备了点击流,以便我知道哪个用户ID读取...
我正致力于数据挖掘项目,以从智能仪表数据中挖掘人类活动模式。我无法找到KMeans的解决方案或如何使用KMeans算法进行群集。数据就像......
在R中使用kmeans导致以下问题:kmeans中的错误(smpl $ LOAN_AMOUNT,centers = 10):比不同的数据点更多的集群中心。我提供了主要数据集的样本......
我正在尝试使用Kmeans对数值变量进行离散化。它工作得很好,但我想知道如何在群集中找到间隔。我和FactoMineR合作做我的kmeans。我发现3 ...
我正在尝试在69列和1000行的数据帧上执行k-means。首先,我需要首先使用Davies-Bouldin指数来确定最佳簇数。这个算法......
我想根据预先确定的中心点(my_center_Points)对Long和Lats(my_long_lats)列表进行分组。我跑的时候: - k
目前,我尝试在分组数据中找到群集的中心。通过使用示例数据集和问题定义,我能够创建包含每个组的kmeans集群。但是当谈到......
我必须计算用户评级的质心。我的数据存储在看起来像这样一个矩阵(想象一下,我们有4个用户和12条):[0,1,0,-1,0,2,3,4,1,0,0,0] [0,1,1,-1,0,2,3,4,1,0,2,0],[...
我只是试图让我的头围绕聚类。我有一系列数据点 - y - 它们具有与之相关的噪声函数(高斯)有两类值0和> 0(...