k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

我想让我的脚本查看给定年份的抽象列,以创建一个集群。

谢谢你的时间,伙计们,请我需要你的帮助。这个看的是所有带文字的栏目,应该是只看抽象的栏目,按每个年份来得出聚类。所以...

回答 0 投票 0

什么是使用k均值的矢量量化?

首先,有人可以解释什么是矢量量化,其目的以及它的作用吗?其次,也将理解关于如何使用k均值来做到这一点的解释。作记录,...

回答 1 投票 4

如何使用Kaggle提供的TPU?

我目前正在研究Kaggle Spotify 1921-2020数据集,该数据集具有16万行数据。我正在执行的任务之一是使用KMeans聚类区分流派,而我陷入了寻找k ...

回答 1 投票 -2

如何绘制K均值并在聚类之外打印点

[如何绘制以下数据的K均值,商店编号,收入,利润,状态,国家0,101,779183,281257,WD,印度1,101,144829,838451,WD,印度2,101,766465,757565,AL,日本我的代码在导入下面...

回答 3 投票 0

如何在K均值聚类后获取数据集的子集

我有一个数据集val_lab,如下所示:[[52.85560436 -23.61958699 34.40273147] [70.44462451 -2.74272277 80.32988099] [38.32222473 -11.22753928 24.09593474] [84.83470029 -7.73898094 28 ....

回答 2 投票 0

如何在Kmeans聚类后获得数据集的子集

我有一个像这样的数据集:val_lab:[[52.85560436 -23.61958699 34.40273147] [70.44462451 -2.74272277 80.32988099] [38.32222473 -11.22753928 24.09593474] [84.83470029 -7.73898094 28 ....

回答 2 投票 0

是否可以确定用于R聚类的不同属性的权重?

我正在使用〜70个属性来使用K均值和分层技术(可能最终使用混合的分层K均值聚类技术)来创建聚类。有没有办法找出...

回答 1 投票 1


在进行PCA和聚类分析时保持与观察相关的分组变量的实用方法

考虑在此创建的数据帧数据:set.seed(123)数据

回答 1 投票 1

添加新列表以键入双倍for循环

我正在进行KMeans聚类,在此之前我也进行了主成分分析。我正在尝试寻找不错的可用集群。为此,我想自动查看...的数量的哪个值...

回答 1 投票 0

如何获得Kmeans的中心点

下面是我正在使用的数据集的示例:id,产品,商店,收入,store_capacity,状态1,球,AB,222、1000,CA 1,笔,AB,234、1452,WD 2, Books,CD,543,888,MA 2,Ink,EF,123,9865,...

回答 1 投票 0

在RStudio中将簇值创建和设置为新的k均值分类

我想创建一个简单的kmeans无监督分类。我在创建群集并将群集值设置为新栅格时遇到问题。这个网站启发了我。 landsat5

回答 1 投票 0

如何处理K均值聚类中的缺失值?

我正在根据客户针对不同类型产品类别的购买进行细分。下面是我的数据的虚拟表示。 (数据以每笔总收入的百分比表示。

回答 1 投票 -1

如何散布Kmeans图并打印离群值

我正在使用Scikit-Learn KMeans模型。这是我实现的代码,在其中创建了3个群集(0、1、2):df = pd.read_csv(r'1.csv',index_col = None)傻瓜= pd.get_dummies(...

回答 1 投票 0

数组与该数组中的元素分配的变量之间的怪异依赖关系

[更改从数组的元素分配的变量时,数组中的该特定元素随变量而变化。但是,在代码中没有什么地方要更改数组。在...

回答 1 投票 1

K-Means GridSearchCV超参数调整

我正在尝试通过在带有决策树分类器的管道中使用它来对时空K均值聚类进行超参数调整。这个想法是使用K-Means聚类算法来...

回答 1 投票 1

更有效的方法来计算R中的rowNorm?

我编写了一个使用无监督K均值算法的程序来尝试压缩图像。现在可以使用,但是与Python相比,它的运行速度慢得令人难以置信!具体来说,它是在查找rowNorms太慢了。 ...

回答 1 投票 1

为什么采用K均值算法优于Kruskal的聚类算法

我正在使用Coursera上的Andrew Ng的机器学习课程。在讨论聚类时,他告诉我们K-表示聚类算法是使用最广泛的算法。我还使用了Kruskal的算法...

回答 1 投票 3

Pyspark:K表示模型拟合时的聚类错误

虽然运行K意味着使用pyspark进行聚类,但我正在使用以下代码行来找到最佳K值。但是在模型拟合线中会不断弹出一些错误。 ...

回答 1 投票 0

PySpark从目录中以json格式读取多个txt文件

我目前正在分布式数据库类中执行一项任务,以读取以json文件格式编写的tweet数据的txt文件,并将tweet加载到数据帧中(然后通过pyspark的...运行它们)] >> [[

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.