cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

是否有关于肘法中k值的最佳范围的研究?

我的主要问题是以某种方式定位k值的范围以执行弯头分析。目前,我只能想到2到min(num_rows,num_columns)之间的范围。还有其他...

回答 1 投票 0

将事件分配给预定义的形状

我的问题是根据这里讨论的内容和那里给我的建议提出的。我从七个设备(每个都是响应性像素传感器的XY矩阵;以CCD相机为例)中获取数据。 ...

回答 1 投票 0

在k中找到最接近的质心表示聚类

X = [1.8421 4.6076; 5.6586 4.8; 6.3526 3.2909; 2.904 4.6122; 3.232 4.9399; 1.2479 4.9327]而质心= [3 3; 6 2; 8 5]我正在尝试...

回答 1 投票 0

“ [tmp c]的含义= max(S(:,I),[],2); c(I)= 1:K; ”在MatLab中

我正在尝试将AP群集的参考实现转换为C ++。这条语句序列使我感到困惑,因为它看起来好像向量c充满了一些数字,然后迅速地...

回答 1 投票 1

如何使用sklearn中的DBSCAN方法进行聚类

我有一个用于聚类的三参数数据库。例如,我可以通过sklearn从Kmean轻松获得图像结果,例如:(val是我的数据库,其形状像(3000,3))y_pred = KMeans(...

回答 1 投票 0

k用于群集-如何将字符串转换为浮点数

从sklearn.cluster从matplotlib导入pyplot导入KMeans为plt,失真= [],对于范围(1,10)中的k:,kmeans = KMeans(init =“ k-means ++”,n_clusters = k,random_state = 0 ,n_init = 12,max_iter = ...

回答 1 投票 0

剪影方法:随着K的增加,分数总体上增加

[与在线教程不同,轮廓图具有全局最大值。我的情节总体上随着K数的增加而增加。但是我可以找到局部最大值。我应该那样做吗?我也用过...

回答 1 投票 0

用于识别相似数据的算法?

我已经获得了youtube趋势数据集,并为其分配了一个预测模型,该模型可以至少以60%的精度输出视频进入趋势的可能性。我有标题,...

回答 1 投票 0

如何基于通用内容对列表进行聚类?

我正在寻找一种算法,能够对内容几乎相同的字符串列表进行分组。这是列表的示例。总共有5个不同的词。 A = [“第一,第二,第三”] ...

回答 1 投票 1

MySQL在用户购物车中创建相似商品的分布或频率列表

自从我发布这个问题已经有一段时间了;只是好奇是否有人可以对此采取诚实的行动。这是我有的桌子+ ---------------------- + | cart_product_table | + --------------...

回答 1 投票 0

是否有一种方法可以通过R中的K均值内的变量来计数/着色?

我已经在数据帧上部署了K-Means,我想看看每个集群中每个组有多少个。 train2

回答 2 投票 0

如何在文件目录中群集多个csv文件

我有多个具有相同数据结构的csv文件,我希望一次将每个csv文件聚类,从sklearn导入指标导入os导入pandas作为pd导入numpy as np导入glob df = pd...。

回答 2 投票 0

使用R中的聚类运行多个回归

我通常需要运行以下回归时使用以下代码。结果

回答 1 投票 0

如何将详细文本映射到一个字母组合或二元组

我正在尝试找出要求的解决方案,其中要求将长文本映射为unigram或bigrams。例如,“具有激励和管理团队的能力。您应该能够跟踪...

回答 1 投票 0

根据数据将K均值标签从低到高排序

我有一个“压力”数据系列。我用scikit执行了3个聚类K均值。我需要为每个数据的簇分配标签的标签,从低到高排序,因此“低压”值具有...

回答 1 投票 0

使用DBSCAN进行聚类:如果不预先设置聚类数,如何训练模型?

我正在使用sklearn的内置数据集虹膜进行聚类。在KMeans中,我预先设置了群集数,但是对于DBSCAN而言并非如此。如果不设置......>

回答 1 投票 0

graphViz中的突出显示群集或子树

我想使用不同的颜色突出显示给定树中的各种子树。例如考虑下面的二叉树(我可以显示父级及其子级之间的边缘)0 ...

回答 1 投票 1

我应该使用哪种机器学习来对特征进行聚类?

因此,我具有由多个用户使用每个软件所花费的时间组成的数据,我想确定同时使用的软件组合。基本上我想集群...

回答 1 投票 -1

如何使用python群集4个不同的csv文件

在作业中,您需要对属于四个类别的单词进行聚类:动物,国家,水果和蔬菜。单词分为四个不同的部分。每行的第一个条目...

回答 1 投票 -1

我如何找出有损失的样本数量>中位数损失;和使用R

我如何找出损失的样本数>损失中位数;以及使用R中的层次聚类造成的损失。我正在使用数据集Allstate声明严重性,我认为数字...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.