cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

Matlab中的确定性函数用于聚类

我一直在使用Matlab内置的kmeans函数来进行聚类。由于算法中使用的随机性,如果我设置不同的种子,结果是不同的。这有点烦人。有没有 ...

回答 3 投票 -2

通过相似性进行面部聚类

我正在使用Luxand Face API来检测面部并从中提取字节向量(名为TemplateId)。使用这个我可以比较两个面孔之间的相似性。现在假设我有很多模板...

回答 1 投票 0

从一组文档中提取重要的子部分和与之关联的子文档集

我有一套文件,所有这些文件都属于“犯罪”类别。现在,我想将它们分类为多个(可能是重叠的)文档集群,其中每个集群都是......

回答 2 投票 0

如何克服不确定矩阵误差(NbClust)?

调用NbClust()时出现以下错误:NbClust中的错误(data = ds [,sapply(ds,is.numeric)],diss = NULL,distance =“euclidean”,:TSS矩阵是无限的。一定也是......

回答 2 投票 0

查找在Python中将一个集群列表转换为另一个集群的映射[重复]

我正在使用scikit-learn来聚集一些数据,我想比较不同聚类技术的结果。我立刻面临着集群标签的问题......

回答 2 投票 1

使用python绘制文本聚类中的单词

对于我的聚类,我得到了如下图所示的结果。是否有任何类似于fvid_clusters的库可以生成如下所示的图? (使用PYTHON)

回答 2 投票 0

如何基于属性子集(4个属性)对数据进行聚类?

我有一个pandas DataFrame,它保存一些对象的数据,其中包括对象的某些部分(Left,Top,Right,Bottom)的位置。例如:ObjectID Left,Right,Top,Bottom 1 ......

回答 2 投票 -1

如何选择最重要的功能?特色工程

我在此链接中使用了gower距离函数:https://sourceforge.net/projects/gower-distance-4python/files/。我的数据(df)是每行都是交易,每列都是......

回答 2 投票 -1

如何确定ID的分组是否相似? [重复]

我已经对我的数据应用了两种不同的聚类算法,我想表达这些算法的结果之间的共性。数据组织为; “ID”=标识符“Group_1”= ...

回答 1 投票 -1

执行分层群集时出现内存错误

我有一个大型数据集(207989,23),我正在尝试立即在一列上应用Hierarchical clustering来测试它是否适合我手头的任务。我试过的:导入numpy ......

回答 1 投票 -1

根据2(并且理想地推广到n)任意分组规则对字母串列表进行聚类?

我想根据包含n个给定集合的任何/所有/无字母,对n组中可变长度的一组字符串(字母)进行排序。例如,在这里,我试图对...的所有组合进行排序

回答 1 投票 1

K-means聚类于名义数据?

我正在对一些不同程度的数据点进行聚类,如低,中,高。是否可以将它们转换为数字,如low-1,med-2,hig-3,并应用k表示......

回答 2 投票 -1

使用k均值在图像之间标记0和1

我有两个数组,X和Y,我想用k-means来确定像素在图像X和Y之间的位置变化。我可以简单地说,它们之间有区别并说:哪里是零,不是.. 。

回答 1 投票 0

没有交叉验证的 Scikit Learn GridSearchCV(无监督学习)

是否可以在没有交叉验证的情况下使用 GridSearchCV?我正在尝试通过网格搜索优化 KMeans 聚类中的聚类数量,因此我不需要或不需要交叉验证。

回答 5 投票 0

如何计算聚类的基尼系数

我有5000个观察结果聚集成10个聚类。每个群集有1000个真实的观察。每个群集中的实际观测值为1000。但是,在运行了我的聚类之后......

回答 1 投票 3

如何减少Prado用于R中大数据的k-means框架中的内存使用?

我试图验证普拉多基于回报相关矩阵的交易策略的k-means框架,如他的论文中所见,使用R表示大量策略,比如1000.他......

回答 1 投票 0

Python:如何使用k-means算法比较聚类之间的相似性?

我对同一事件有两个观察结果。假设X和Y.我想有nc簇。我正在使用sklearn进行聚类。 x = KMeans(n_clusters = nc).fit_predict(X)y = KMeans(n_clusters = nc)...

回答 2 投票 0

如何将群集标签列添加回原始dataframe-python中,以进行监督学习

我的数据框中有一列包含Url信息。它有1200多个独特的价值观。我想使用文本挖掘从这些值生成功能。我用tfidfvectorizer来生成......

回答 1 投票 1

我如何使用pyclustering来实现kmedoids?

我不确定我是如何在python中使用kmedoids的。我已经从https://pypi.org/project/pyclustering/安装了pyclustering模块,但我不确定我怎么称为kmedoids?我正试图在......上实施PAM

回答 2 投票 0

数据挖掘中的分类和聚类之间的区别? [关闭]

有人能解释数据挖掘中分类和聚类之间的区别吗?如果可以,请举两个例子来理解主要想法。

回答 21 投票 182

© www.soinside.com 2019 - 2024. All rights reserved.