hierarchical-clustering 相关问题

分层聚类是一种聚类技术,可在多个层级生成聚类,从而生成聚类树。分层聚类为具有可视化潜力的分析师提供了优势。

如何遍历从sklearn AgglomerativeClustering一棵树?

我曾在某numpy的文本文件数组:https://github.com/alvations/anythingyouwant/blob/master/WN_food.matrix它的术语和相互之间的距离矩阵,我的条件的名单是这样:HTTP:// ...

回答 2 投票 5

如何在python中进行数据关联聚类图

我有一个数据库,其中包含有关回购的提交信息。例如commit-sha1 | file1 | commit-sha1 | file2 | commit-sha2 | file2 | commit-sha2 | file3 |等等。基本上......

回答 1 投票 0

用Matlab剪切树状图

有没有办法在Matlab中剪切树状图?我希望在100的距离有一个限制,但我无法弄清楚如何将它添加到函数中。

回答 1 投票 0

根据R上的文化相似性对一组国家进行聚类

我在试图利用我已经拥有的一种文化相关性来聚类国家时遇到了一些问题。基本上,数据集看起来像这样:有90个国家,91列(90个国家......

回答 3 投票 -2

Python中的SciPy分层字符串聚类?

在我以前的一个Stack Overflow问题(这里)中,我建议使用Hierarchical Clustering根据汉明距离对列表中包含的字符串进行分组。我发现了其他几张海报......

回答 1 投票 2

什么是SKLearn的Birch Clustering中的partial_fit(),它可以用于非常大的数据集吗?

我的数据是轻尾的,两个极端都有几个异常值。我正在使用Birch对数据进行聚类,之前我使用RobustScaler来转换数据,然后使用PCA来减少......

回答 1 投票 0

分层聚类中的链接

我得到“ValueError:链接矩阵'Z'必须有4列。” X = data.drop(['grain_variety'],axis = 1)y = data ['grain_variety'] mergings = linkage(X,method ='complete')树形图(X,labels = ...

回答 1 投票 0

合并最近项的算法

下面是层次结构聚类图。首先,我有几个项目如下:我想根据它们的距离以分层方式聚类上述项目。在上面......

回答 1 投票 0

使用R的聚类算法

我其实是想创建一个热图。所以我需要找到一个合适的聚类方法。以下是我的数据框的示例:df1 g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11 1 1 1 0 0 3 4 4 0 0 ...

回答 1 投票 0

分层/嵌套引导手段

我正在尝试执行分层引导以从具有嵌套数据结构的大型数据集中获取一些示例方法。我有一个类似于这个的数据集:ball

回答 2 投票 0

切片索引必须是整数或无,或者在对列表进行双节切割时具有__index__方法类型错误

当我试图运行代码以截取cItems列表时,我正在纠结上述错误 - 代码来自Python 2.7,现在需要运行3.6 - 任何想法? cItems = [[8,3,9,2,10,1,7 ......

回答 1 投票 0

在R中是否有一种方法可以直观地显示哪个属性导致分层群集中的群集?

分层聚类将基于相似度矩阵对最相似的项进行分组。但是,如何确定群集的相似之处,以及如何在视觉上展示......

回答 2 投票 0

R rect.hclust:树形图中的矩形太高

我让一些不同的专家根据它们的相似性对92个对象进行排序。基于他们的答案,我构建了一个92 x 92相异矩阵。在R中,我使用...检查了这个矩阵

回答 1 投票 1

树状图中坐标图坐标与ClusterNodes之间的关系

我正在寻找一种方法来获取树形图中基于其ClusterNode返回to_tree的聚类点的坐标。使用scipy从数据构建树形图,例如:X =数据Y = ...

回答 2 投票 2

如何基于属性子集(4个属性)对数据进行聚类?

我有一个pandas DataFrame,它保存一些对象的数据,其中包括对象的某些部分(Left,Top,Right,Bottom)的位置。例如:ObjectID Left,Right,Top,Bottom 1 ......

回答 2 投票 -1

如何选择最重要的功能?特色工程

我在此链接中使用了gower距离函数:https://sourceforge.net/projects/gower-distance-4python/files/。我的数据(df)是每行都是交易,每列都是......

回答 2 投票 -1

执行分层群集时出现内存错误

我有一个大型数据集(207989,23),我正在尝试立即在一列上应用Hierarchical clustering来测试它是否适合我手头的任务。我试过的:导入numpy ......

回答 1 投票 -1

如何在不使用docker容器的情况下在Open Server中运行Docker镜像

我正在设置一个包含7个服务器的集群环境,我已经创建了一个已配置应用程序的docker镜像。我需要在我的开放服务器中使用该docker镜像,但不是......

回答 1 投票 1

dbscan中基于密度和阈值的聚类

我正在研究工业零件的一些热温数据。我有温度值的零件的像素温度。我想使用dbscan来识别具有...的集群的部分

回答 1 投票 0

树形图y轴标记混淆

我在pandas中有一个大的(106x106)相关矩阵,结构如下:+ --- + ------------------- + --------- --------- + ------------------ + ------------------ + - ---------------- + ---------------...

回答 1 投票 10

© www.soinside.com 2019 - 2024. All rights reserved.