cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

R中的聚类分析:确定最佳聚类数

作为R的新手,我不太确定如何选择最佳数量的聚类来进行k均值分析。绘制下面数据的子集后,适合多少个群集?我怎么能够 ...

回答 7 投票 409

如何使用PAM数据定义fviz_cluster中的维度?

我有一个数据框,分为行中的样本和列中的变量。执行PCA时:df.pca

回答 1 投票 0

处理内存错误(Python sklearn集群)

我有一个数据集,每个数据都有稀疏标签。所以,下面是数据的样子。 [[“Snow”,“Winter”,“Freezing”,“Fun”,“Beanie”,“Footwear”,“Headgear”,“Fur”,“在雪地里玩”,“摄影”],[“树” ...

回答 1 投票 -1

分层聚类:确定最佳聚类数并统计描述聚类

我可以对R中的方法使用一些建议来确定最佳簇数,然后用不同的统计标准描述簇。我是R的新手,对...有基本的了解。

回答 4 投票 12

ELKI可以聚集非标准化的负点吗? [重复]

我已经解决了这个问题,但解决方案没有帮助。 ELKI Kmeans聚类高维数据的任务失败错误这是我第一次使用ELKI,请耐心等待。我有 ...

回答 1 投票 0

如何使用matplotlib绘制由KMeans生成的集群?

我使用KMeans进行聚类,如下所示,但我不知道在散点图中绘制我的聚类。或者喜欢这个情节我的代码是:来自sklearn.feature_extraction.text import TfidfVectorizer ...

回答 1 投票 -1

R中使用余弦的术语聚类和可视化

我是文本挖掘和R的新手。我使用一组文档中的kmeans进行术语聚类。在对术语进行分组时,我使用了余弦公式。我要集群的有839个文件的57个术语。但......

回答 2 投票 0

将多维集群绘制到2D绘图python

我正在集中处理大量数据,这些数据有两个不同的集群。第一种类型是6维簇,而第二种类型是12维簇。现在我决定......

回答 2 投票 2

R中的聚类分析:K-means中的弯头方法

我正在使用R包fviz_nbclust将elbow方法实现到我的数据集。该方法将通过从1 ... k变化K来计算每个簇的总和平方内的总和。例如......

回答 1 投票 0

基于质心的meanshift算法用于聚类的距离度量是多少?

我有一个尺寸为810 * 74的稀疏TruncatedSVD矩阵。我正在尝试使用sklearn api以基于质心的MeanShift算法进行聚类。但是,我找不到有关...的信息

回答 1 投票 0

使用一个标称比例对3D数据进行聚类

问题陈述我有2D熊猫数据帧,其中包含有关用户工具使用特征的数据(例如,系统A的使用率为88%,系统B的使用率为11%,相应用户的系统C为1%:A ...

回答 1 投票 -1

聚类多变量时间序列 - 关于距离矩阵的问题

我正在尝试使用R集群气象站。站点提供温度,风速,湿度等数据,每小时一次。我可以轻松地聚 集单变量时间序列......

回答 2 投票 0

如何计算BCubed精度和召回率

根据这个公布的页面BCubed精度和召回率,因此F1-Measure计算是评估聚类性能的最佳技术http://cs.utsa.edu/~qitian/seminar/Spring11 / ...

回答 1 投票 2

什么是期望最大化技术的直观解释? [关闭]

期望最大化(EM)是一种对数据进行分类的概率方法。如果我错了,请纠正我,如果它不是分类器。这种EM技术的直观解释是什么? ...

回答 8 投票 98

为什么K-means聚类的分类准确性随着训练数据的增加而降低?

我想对视频中的动作进行分类。为此,将K均值聚类应用于光流点以生成码本。当k = 200时,精度最初为85%。加入培训后......

回答 1 投票 -2

如何将spark mllib模型存储到本地文件系统(windows)

我试图将我的Kmean集群模型保存到本地文件系统中。我正在使用Pyspark mllib进行Kmean聚类。但是我收到以下错误。格式(target_id,“。”,名称),值)...

回答 2 投票 0

如何在R中显示特定的群集?

我有一个数据集,其中包含每个州的年份测试分数,我使用以下代码对其进行了聚类:cluster.m4

回答 1 投票 0

如何从Word2Vec模型中提取矢量进行聚类

我有一个我训练过的word2vec模型。该模型基于~95,000字的语料库。我想只选择语料库中的那些词,例如形容词。为此,我们假设......

回答 1 投票 1

R中面板数据回归中的Wild cluster bootstrap

我在R中进行面板数据回归。数据集包括几年来Cantons(瑞士司法管辖区)的几个变量。准备数据:> install.packages(“clusterSEs”)> ...

回答 2 投票 1

将GPS数据聚类为“k”组

我有一个GPS(经度和纬度对)数据列表(~3000),我想根据它们的距离(测地线和/或欧几里德)将它们分成“k”组。最好的方法是什么?

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.