聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。
我一直在使用Matlab内置的kmeans函数来进行聚类。由于算法中使用的随机性,如果我设置不同的种子,结果是不同的。这有点烦人。有没有 ...
我正在使用Luxand Face API来检测面部并从中提取字节向量(名为TemplateId)。使用这个我可以比较两个面孔之间的相似性。现在假设我有很多模板...
我有一套文件,所有这些文件都属于“犯罪”类别。现在,我想将它们分类为多个(可能是重叠的)文档集群,其中每个集群都是......
调用NbClust()时出现以下错误:NbClust中的错误(data = ds [,sapply(ds,is.numeric)],diss = NULL,distance =“euclidean”,:TSS矩阵是无限的。一定也是......
查找在Python中将一个集群列表转换为另一个集群的映射[重复]
我正在使用scikit-learn来聚集一些数据,我想比较不同聚类技术的结果。我立刻面临着集群标签的问题......
对于我的聚类,我得到了如下图所示的结果。是否有任何类似于fvid_clusters的库可以生成如下所示的图? (使用PYTHON)
我有一个pandas DataFrame,它保存一些对象的数据,其中包括对象的某些部分(Left,Top,Right,Bottom)的位置。例如:ObjectID Left,Right,Top,Bottom 1 ......
我在此链接中使用了gower距离函数:https://sourceforge.net/projects/gower-distance-4python/files/。我的数据(df)是每行都是交易,每列都是......
我已经对我的数据应用了两种不同的聚类算法,我想表达这些算法的结果之间的共性。数据组织为; “ID”=标识符“Group_1”= ...
我有一个大型数据集(207989,23),我正在尝试立即在一列上应用Hierarchical clustering来测试它是否适合我手头的任务。我试过的:导入numpy ......
根据2(并且理想地推广到n)任意分组规则对字母串列表进行聚类?
我想根据包含n个给定集合的任何/所有/无字母,对n组中可变长度的一组字符串(字母)进行排序。例如,在这里,我试图对...的所有组合进行排序
我正在对一些不同程度的数据点进行聚类,如低,中,高。是否可以将它们转换为数字,如low-1,med-2,hig-3,并应用k表示......
我有两个数组,X和Y,我想用k-means来确定像素在图像X和Y之间的位置变化。我可以简单地说,它们之间有区别并说:哪里是零,不是.. 。
没有交叉验证的 Scikit Learn GridSearchCV(无监督学习)
是否可以在没有交叉验证的情况下使用 GridSearchCV?我正在尝试通过网格搜索优化 KMeans 聚类中的聚类数量,因此我不需要或不需要交叉验证。
我有5000个观察结果聚集成10个聚类。每个群集有1000个真实的观察。每个群集中的实际观测值为1000。但是,在运行了我的聚类之后......
如何减少Prado用于R中大数据的k-means框架中的内存使用?
我试图验证普拉多基于回报相关矩阵的交易策略的k-means框架,如他的论文中所见,使用R表示大量策略,比如1000.他......
Python:如何使用k-means算法比较聚类之间的相似性?
我对同一事件有两个观察结果。假设X和Y.我想有nc簇。我正在使用sklearn进行聚类。 x = KMeans(n_clusters = nc).fit_predict(X)y = KMeans(n_clusters = nc)...
如何将群集标签列添加回原始dataframe-python中,以进行监督学习
我的数据框中有一列包含Url信息。它有1200多个独特的价值观。我想使用文本挖掘从这些值生成功能。我用tfidfvectorizer来生成......
我不确定我是如何在python中使用kmedoids的。我已经从https://pypi.org/project/pyclustering/安装了pyclustering模块,但我不确定我怎么称为kmedoids?我正试图在......上实施PAM
有人能解释数据挖掘中分类和聚类之间的区别吗?如果可以,请举两个例子来理解主要想法。