hierarchical-clustering 相关问题

分层聚类是一种聚类技术,可在多个层级生成聚类,从而生成聚类树。分层聚类为具有可视化潜力的分析师提供了优势。

基于SPSS和R中的3个变量的分组组

我目前正在尝试了解聚类分析(使用SPSS和R)。读了太多有关它的文章后,我进一步困惑了使用哪种聚类方法来回答研究问题。我的...

回答 1 投票 0

将可调用度量用于HDBSCAN *

我想用HDBSCAN *集群一些数据。距离是根据两个值中某些参数的函数计算得出的,因此,如果数据看起来像这样:标签2 | label3 0 32 18.5 ...

回答 1 投票 0

层次聚类:如何更新距离矩阵?

我想根据伪代码实现简单的分层聚集聚类:我陷入了需要更新距离矩阵的最后一部分。到目前为止,我有:import ...

回答 1 投票 0

将颜色条添加到聚类的热图

[我正在尝试复制这种类型的图(带有颜色条的热图,叶子)。到目前为止,这是我做的工作,以pd import numpy的形式导入panda,以NP的形式从scipy的plt导入np的matplotlib.pyplot...。

回答 1 投票 0

基于机器学习的聚类算法

在数据集中,我有N个设备执行q个应用程序的p项任务(例如:振铃,振动,贪睡)。因此,在启动应用程序时,它需要执行某些任务并返回结果...

回答 1 投票 0

R模式中k模式聚类的迭代次数

我一直在尝试使用NBClust库执行集群。我的数据集包含分类变量和数值变量,而我有一个热编码的分类变量。用此方法获得的结果...

回答 1 投票 -3

scikit-learn:数据集不断增长的层次聚集聚类性能

scikit-learn == 0.21.2层次聚集聚类算法,响应时间在增加数据集时呈指数增长。我的数据集是文本的。每个文档的长度为7-10个字。 ...

回答 1 投票 0

R中带有'where'语句的段bin字符串

我已经尝试对数据集执行许多算法以进行聚类,现在希望对数据进行“哪些”陈述来应用管理细分。我想知道什么能使更多...

回答 1 投票 1

如何使用R中的clValid包确定Dunn指数?

我正在尝试复制期刊论文的结果,作者提出了一种聚类算法,并使用R中的clValid为所得聚类计算了Dunn索引。我是...

回答 1 投票 1

如何使用相关性或聚类分析来组织数据以创建热图(x必须是数字问题)

我在通过聚类分析和相关性生成热图时需要一些帮助(我是R的新手)。我的数据在Excel中如下所示:Gene1 Gene2 Gene3 Gene4 Gene5 ... Gene296 ...

回答 2 投票 -1

如何获得层次统计平均聚类的差异统计>>

我基于'平均链接'执行层次聚类分析,在基数r中,我使用dist_mat

回答 1 投票 0

从图像中提取主要/最常用的颜色

我想提取图像中最常用的颜色,或者至少提取主要色调。您能推荐我如何开始此任务?或指向我类似的代码?我一直在寻找...

回答 3 投票 5

集聚法的精度?

我已经使用最大结块方法绘制了树状图。 hc

回答 1 投票 0

如何将无监督的层次聚类结果与原始数据合并

我在R中进行了无监督的层次聚类分析。我的数据是3列和120,000行左右的数字。我设法使用切割树并识别出6个群集。现在,我需要返回...

回答 1 投票 0

Python数据框中具有单个链接的分层聚类

我有一个熊猫数据框来进行层次聚类。 ABCA 0 1 3 B 1 0 2 C 3 2 0我尝试的代码:z = linkage(df,'single')dn = dendrogram(z,labels = index)然后我得到了...

回答 1 投票 0

基于聚类的距离矩阵

我的目标是集群的话基础上,他们是多么相似相对于文本文档的语料库。我已经计算每对词之间的Jaccard相似。换句话说,我有一个...

回答 3 投票 21

比较k-均值与聚类聚类结果

我有一个数据集(数值)和I产生的K-means算法来创建基于特征的簇。对于K-手段,因为我们分配的簇的数目,我想尝试不同的方法和...

回答 1 投票 -1

SciPy的树状图的简单着色

我想创建一个单色(例如,白底黑字)使用SciPy的树状图。在SciPy的文件后,我一直在玩的set_link_color_pallete功能,但一直得到只是一个...

回答 1 投票 1

在Python层次聚类的凸包

我使用分层聚类,试图想象一大组已夷为平地,两个维度的数据。我想要做的就是创建一个可视化的,让我看看数据...

回答 2 投票 2

ValueError异常:允许的最大尺寸超标,AgglomerativeClustering fit_predict

我试图在100.000对象的23维的数据集适合分层聚类。如何解决下面的错误? >>> AC = AgglomerativeClustering(n_clusters = 2,亲和力= '欧几里得',...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.