聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。
我有数百个7X6阶矩阵的数据。我想将它们聚集起来。 我尝试使用简单的聚类算法,将其转换为 42 维空间中的一个点并选择欧几里得距离...
到目前为止,我发现使用 k 模式进行内部集群验证的选项很少。 然而,我最近发现一篇论文使用了称为 SW/SB 比率的验证指标。 SW = 标准差...
我的数据中有数百万个主题。这些主题为 1 到 12 个单词。例如,“癌症生物学和遗传学”可能是一个主题,“再生医学”可能是另一个主题。我想创造
我有一个数据集,其中包含 30 个人的观察结果,每个人都做了 20 个实验。假设我的数据如下所示: ID 试验反应响应 prop_1 prop_2 “s1&qu...
我尝试获取威斯康星州的地图,并尝试对空间数据点进行克拉克-埃文斯测试。但是,当我导入威斯康星州地图并尝试将其转换为窗口时,我遇到了错误: 警告
hdbscan 错误:TypeError:'numpy.float64' 对象无法解释为整数
我在 Linux 和 google colab 上运行 hdbscan 函数代码并得到相同的错误 类型错误:“numpy.float64”对象无法解释为整数 将数据应用于 t 时似乎发生错误...
我在 Alteryx 上的 k 均值聚类结果面临一些问题。我正在尝试对大约 5000 个文本描述的数据集进行主题建模。数据清理、解析、删除后...
我对编程场景相当陌生,并且不知所措:D我想应用Hoshen-Kopelman算法在矩阵中进行聚类检测,然后确定最大的“大小”
我在R中使用欧氏距离和hclust中的Ward.D2方法进行了聚类分析。我想使用这些聚类中心作为 K 均值分析的起点。但我不知道如何提取
版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同集群结果
我正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在将 scikit-learn 从版本 0.22.2 更新到版本之后...
我想对这个散点图进行聚类(y 轴是测量的密度,x 轴是时间)。 有什么办法可以得到图中红色突出显示的点吗?这有意义吗
Kmeans:两个版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同聚类结果
我目前正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在从 0.22 版本更新 scikit-learn 后...
假设 sklearn 的 AgglomerativeClustering 返回了 10 个集群。有没有办法获得 10 个簇之间的一些成对距离? 具体来说,假设有 10 个簇,...
路由和交付的聚类问题 我的问题有两条腿。 第一站: 我有一家商店的精确位置。用于点的两列是纬度和经度。我要……
早上好! 我试图了解 Leiden 算法及其用于查找分区和聚类的用法。 文档中提供的例子已经直接找到分区了,比如...
互信息 (MI) 是无监督学习(聚类)中需要考虑的重要因素吗?
我有一个监督学习问题。求解过程的最后一步是分割。 MI 最低的特征会影响聚类过程吗? 我关于流失客户细分的问题......
我需要在 SQL 中找到客户注册集群的最早日期。客户可以在 90 天内注册多项服务,但这都被视为一个“事件”。我
我目前正在使用 ASJP 数据库进行研究,我有一个 30 种语言之间相似性的距离矩阵,形状为 (30 x 30)。我想在...上执行 K-Means 聚类
How to implement cluster-robust variance estimators in R fixst [关闭]
我指的是尼尔森 MacKinnon 的新论文。韦伯:聚类稳健推理:实证实践指南 我如何在 feols 中实现建议的聚类稳健方差估计器
ConsensusClusterPlus 函数和 pFeature 参数的子采样出错
以下函数返回一个我无法解决的错误。 请设置<- matrix(runif(50*30), nrow=50, ncol=30) ConsensusClusterPlus::ConsensusClusterPlus(pl.eset, pFeature = 0.50, reps ...