hierarchical-clustering 相关问题

分层聚类是一种聚类技术,可在多个层级生成聚类,从而生成聚类树。分层聚类为具有可视化潜力的分析师提供了优势。

scipy:如何绘制层次聚类树

我有兴趣绘制由hierarchy.to_tree()的输出表示的树。 为了澄清我的问题,我给出以下 MWE: 将 numpy 导入为 np 从 scipy.cluster 导入层次结构 来自...

回答 1 投票 0

opensips的build keepalived中如何配置?

我正在尝试为集群中的节点处理配置opensips keepalived。我遵循了本指南中提到的指示。 https://controlpanel.opensips.org/htmldoc_9_X_X/keepalived.html。之后

回答 1 投票 0

如何使用sklearn指定聚合聚类的内存目录

我正在尝试使用 sklearn 的 AgglomerativeClustering 来优化用于在同一数据集上计算具有不同数量的集群的多个结果的计算时间。 如 s 中所示...

回答 1 投票 0

在 scikit-learn 的凝聚聚类算法中,如何获得所有中间簇?

我正在运行这个相对简单的算法。 如果我正确地理解了算法,如果你聚类到 8 个簇,那么你应该得到 8 个以上的所有簇的结果,对吧? 会...

回答 1 投票 0

蛋白质序列聚类(有/无 MSA)

我有 NGS 数据(仅限唯一克隆),我想使用 Python 语言根据相似性(最好是聚类)对它们进行分组。请查看以下示例序列。也给我...

回答 2 投票 0

对分类序列数据进行层次聚类分析的序列比对

我有一个由 30 个人展示的短期行为数据集。 #加载包 库(TraMineR) # 生成随机非数字序列的函数 生成随机序列 <- function(

回答 1 投票 0

识别 python 数据框中的异常值

我试图在集群模型中识别具有标准差的异常值。 # 计算汇总统计数据 rfm_mean、rfm_std = 平均值(rfm)、std(rfm) # 识别异常值 cut_off = rfm_std * 3 更低,

回答 2 投票 0

在 Python 中使用 scipy 和距离矩阵对数据进行聚类

我正在用Python工作。我正在使用一个二进制数据帧,其中在不同时间为不同用户提供一系列 0 和 1 值。 我可以直接从 datafr 执行层次聚类...

回答 1 投票 0

聚集聚类设置distance_threshold

我有一个数据集,我想使用 AgglomerativeClustering 来查找聚类。 我尝试使用一些示例数组,但无法弄清楚如何设置 distance_threshold。我想用它作为...

回答 1 投票 0

在哪里可以找到一组带有真实标签的良好基准聚类数据集?

我正在寻找一个具有“真实值”标签的聚类数据集,用于一些已知的自然聚类,最好具有高维度。 我在这里找到了一些不错的候选人(http://cs.joensuu.fi/sipu/

回答 2 投票 0

树形图到有向图/树

我正在尝试将树形图转换为图/树,以对其节点、叶子和子树执行计算并找到混合子图,但我还没有找到可以帮助我的函数/包...

回答 1 投票 0

跨多个变量进行配对聚类,尊重预先存在的分组变量

我有一个带有 id 列、G 分组变量和 300 个数字变量的 tibble。 我想要一种方法,将原始数据聚集到每一行都与另一个行在一个簇中匹配/配对的程度...

回答 1 投票 0

如何获取n_clusters(hdbscan.flat.HDBSCAN_flat()的参数)可以指定的最大值

问题1 我收到警告 UserWarning:HDBSCAN 只能计算 3 个集群。当我使用 HDBSCAN_flat() 指定参数 n_clusters=4 时,将 n_clusters 设置为 3...。我可以获得 max_eom_clusters b...

回答 1 投票 0

如何在Python中使用距离矩阵评估聚类的质量?

我正在尝试使用变量之间的相关距离来自定义层次聚类过程,并且我需要评估聚类质量。但是,所有的聚类质量评估方法...

回答 1 投票 0

是否可以预先指定一个聚类结构,然后根据R中常见的聚类标准进行合并?

假设我有一个数据集,我在其中进行了聚类分析,例如 k=9。也许这是来自 k-means,或者我刚刚完成了完整的链接分层聚合,或者我注视着我......

回答 1 投票 0

在 R USArrests 数据集中切割树状图不会返回正确的树状图

我一直在网上寻找教程,但结果不正确 d <- dist(USArrests, method = "euclidean") # distance matrix usarrests_hi_cluster <- hclust(d, method="co...

回答 1 投票 0

sklearn 凝聚聚类输入数据

我有四个用户之间的相似度矩阵。我想做一个凝聚聚类。代码是这样的: lena = np.matrix('1 1 0 0;1 1 0 0;0 0 1 0.2;0 0 0.2 1') X = np.reshape(lena, (-1, 1))

回答 2 投票 0

sklearn 凝聚聚类:集群之间的距离

假设 sklearn 的 AgglomerativeClustering 返回了 10 个集群。有没有办法获得 10 个簇之间的一些成对距离? 具体来说,假设有 10 个簇,...

回答 0 投票 0

如何使用 Python 聚集商店位置以优化路线和交付?

路由和交付的聚类问题 我的问题有两条腿。 第一站: 我有一家商店的精确位置。用于点的两列是纬度和经度。我要……

回答 0 投票 0

对于 R 中的树状图,如何在根据簇为分支着色的同时添加自定义文本?

我有这个树状图: 碳氢化合物<- hclust(dist_s, method = 'average') At first, I was showing it with dendextend: dend = as.dendrogram(hc) par(mar = c(3, 2, 2, 8)) dend %>% 设置(“labels_ce ...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.