k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

多维K均值的绘图结果

我有一个关于R中的Kmeans的问题。我有一个数据框,例如R中可用的IRIS数据。我找到了一个网站,他们在其中创建了kmeans结果,我喜欢:我的问题是,我想...] >

回答 1 投票 1

Kmeans:簇的大小错误

我正在心脏病UCI数据集上的R中运行Kmeans算法。我应该得到2个具有138 165大小的集群,就像数据集中的集群一样。步骤:将数据集存储在数据框中:df

回答 2 投票 0

TESPAR编码方法-如何生成字母?

我利用TESPAR(时间编码信号处理和识别)方法对输入信号进行编码。在将数据划分为多个时期之后,我想为每个时期分配一个符号,但是我有一些...

回答 1 投票 1

对于给定的单词,预测聚类并从聚类中获取最近的单词

我已按照给出此链接的说明对w2v和k-means进行了语料库培训。 https://ai.intelligentonlinetools.com/ml/k-means-clustering-example-word2vec/我要执行的操作a。 ...

回答 1 投票 0

准备用于列中具有唯一值的k均值聚类的股票数据

我拥有达卡证券交易所的数据,合并了359只我想对其进行k均值聚类的股票进行预处理。但是符号的唯一性我无法准备数据。

回答 2 投票 -1

研究簇的sd有时返回NA,有时不返回

我有一系列使用kmeans进行聚类的观察结果。然后,我调查每个群集内的标准偏差(sd)并获得最大值。如果我多次运行相同的代码,有时,...

回答 1 投票 0

基于SPSS和R中的3个变量的分组组

我目前正在尝试了解聚类分析(使用SPSS和R)。读了太多有关它的文章后,我进一步困惑了使用哪种聚类方法来回答研究问题。我的...

回答 1 投票 0


MOA CluStream:如何计算出k个均值后如何“命名”不位于任何宏集群内部的微集群?

我目前正在研究CluStream,对结果有一些疑问。我将继续解释:如果微集群使用K均值进行聚类,我们都知道每个微集群...

回答 1 投票 0

Davies-Bouldin指数越高或越低分数越好

我使用Google Bigquery训练了KMEANS集群模型,它在模型的评估标签中为我提供了这些指标。我的问题是我们是否试图最大化或最小化Davies-Bouldin索引...

回答 1 投票 0

使用二进制变量进行聚类

我有一个数据集,其中一些变量具有二进制类型。第一列是名称,因此在进行聚类分析时会显示错误。 kc

回答 1 投票 -1

基于机器学习的聚类算法

在数据集中,我有N个设备执行q个应用程序的p项任务(例如:振铃,振动,贪睡)。因此,在启动应用程序时,它需要执行某些任务并返回结果...

回答 1 投票 0

我如何使用python将具有200个功能连接的患者分为两组?

我具有100位患者的20个大脑区域的功能连通性,即20 * 20/2 = 200,并且我想将它们分类(聚类)为两组,即那些没有疾病的人群。我该如何使用...

回答 1 投票 -1

外部函数调用中R错误NA / NaN / Inf中的K均值聚类

我有一个在R中创建的数据集。其结构如下:在此输入图像描述,我试图使用k均值对观察结果进行聚类。但是,我收到以下错误消息:...

回答 1 投票 0

具有scikit-learn的K均值算法:质心初始化时的问题

[嗨,我正在尝试使用scikit-learn用k-means算法构造一个简单的示例。在我的示例中,我想使用预定义的群集质心。因此,我正在使用numpy创建np.arrays。 ...

回答 1 投票 0

Floyd-Steinberg实现Python

我使用Floyd-Steinberg抖动处理,以便在使用来自scipy的KMeans处理图像后分散量化误差。给定的数据是RGB文件-用于灰度和彩色。问题是...

回答 1 投票 0

循环辅助的K值

在下面的代码中,当尝试重新运行代码时,是否会像这样利用for循环?对于x在range(2,11)中:kmeans = KMeans()。setK(x).setSeed(1)model = kmeans.fit(dataset)这是其余的...

回答 1 投票 -1

删除CountVectorizer中单个单词的出现

我正在使用CountVectorizer()创建项频矩阵。我想删除词汇表中频率不超过两个的所有术语。然后,我使用tfidfTransformer()创建ti * idf ...

回答 1 投票 -1

如何选择哪些列适合k-Means聚类算法的可视化?

[我正在尝试理解csv文件中列的选择,在应用k-means时应考虑这些选择。在下面的链接中,仅将年度收入和支出得分作为一列...

回答 1 投票 0

在matlab或python中进行聚类分析-在3维数据上进行k均值聚类

我有3D数据。因此,对于705个频率,我有24 * 2数据。 24行代表小时,而列代表均值和方差系数。此24 * 2 * 705矩阵数据。我想执行k -...

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.