cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

如何保持 LCA 模型的最大对数似然?

我想为我的 LCA 模型找到更好的对数似然,但我太确定对数似然是尽可能小,还是尽可能重复? 问题来自 poLCA 论文(htt...

回答 0 投票 0

如何在anaconda中安装fuzzy c-means包?

我尝试了 pip install fcmeans 和 pip install f-c-means,但都没有用。

回答 2 投票 0

使用 k-means 聚类轨迹

我有几个数据帧,其坐标构成了一条直线轨迹: 从数据框中可以看出,轨迹有几个起点和终点坐标,如下所示: 我的问题是...

回答 0 投票 0

在 terra 包中计算 kmeans 和简单结构索引的问题

在 terra 中工作以进行无监督分类 我使用 terra pacakge 已经有一段时间了,现在我想看看我是否可以做一些我以前在光栅中做的任务......

回答 1 投票 0

多人游戏的配对算法

我想在锦标赛中对玩家进行分组,例如 MTG 或 Catan,在 3 到 4 名玩家的桌子上,尽量减少轮空玩家的数量(跳过一轮)。 我尝试了以下代码: 普...

回答 0 投票 0

ValueError:传递值的形状是 (1000, 1),索引表示 (1000, 20)

ValueError:传递值的形状是 (1000, 1),索引表示 (1000, 20) 这是我在 python 中的代码 编码 = OneHotEncoder() encoded_cols = encode.fit_transform(data[['Sex', 'Housing', 'Saving acco...

回答 1 投票 0

Sklearn Gaussian Mixture predict_proba:难以理解结果概率

我们有两个二维的、可分离的簇,如下图所示: 在该数据集上运行 sklearns GMM: 将 numpy 导入为 np 从 sklearn.mixture 导入 GaussianMixture 通用汽车 =

回答 0 投票 0

K 原型模型给我一个断言错误:分类索引大于列数

我正在研究 K-Prototypes,以创建我们公司客户群的细分。下面是我的代码。我已将所有分类变量分配给 catColumnsPos,其中大部分是二进制的。然而,我...

回答 0 投票 0

在 Python 中将浮点数据聚类到合适的桶中

我有一个 csv 文件,其中包含按升序排列的数千个浮点值。我想将这些值聚类/聚类到合适的聚类中。 例如 : 0.001 0.002 0.013 0.1 0.101 0....

回答 1 投票 0

聚类成对距离矩阵

所以假设我有一个预先计算的距离矩阵 1 2 3 4 5 1 0.000 1.154 1.235 1.297 0.960 2 1.154 0.000 0.932 0.929 0.988 3 1.235 0.932 0....

回答 1 投票 0

使用 Sklearn 的 GridSearchCV 降低聚类分析的 DBCV 分数

我在 UTM 坐标中有一个地理数据集“坐标”,我正在对其执行 HDBSCAN,并且希望让 sklearn 的 GridSearchCV 使用 DBCV 验证各种参数。而手动

回答 0 投票 0

如何使用下拉框动态更改所选类别的颜色?

我正在开发一个应用程序,它接受 2 个输入来更新显示聚类分析结果的散点图。第一个输入通过时间范围滑块过滤图表上的点。 ...

回答 1 投票 0

typeError 帮助,plt.scatter 将我的 .csv 读取为真/假而不是数值

我正在关注这篇文章,当我收到此错误时,使用我自己的数据尝试绘制客户订单数量与他们一生的支出: 我尝试从我的数据框中删除真/假值和

回答 4 投票 0

R - 进行线性回归时出现错误“可变长度不同”

总体目标:实现先聚类再预测的方法来预测房价变量MEDV。在尝试通过线性回归对训练集集群进行预测的步骤中,但是得到 ...

回答 0 投票 0

为什么分层凝聚集群将所有实例仅放在一个集群中

我面临这个问题:通过单一、完整和平均的链接,我得到一个由所有实例组成的集群。我举个例子: 计算 2 个集群: 集群 1. 4599 个观测值 集群...

回答 0 投票 0

将集群的元素放入数据框

下面我使用函数主成分分析来降低 1989 年之前的时间序列的维度。之后,我对 fPCA 分数进行聚类。考虑以下问题:

回答 0 投票 0

我怎么能继续合并集群直到没有更多的集群可以合并?

我有一个代码,我想根据某些条件(Radius = 500,K,alpha)连续聚类。试过使用levels,发现并没有按照

回答 0 投票 0

说话人数量估计的分段而不是二值化

我正在使用 pyannote 的二值化来确定音频中的扬声器数量,其中无法预先确定扬声器的数量。以下是通过二值化确定说话人数量的代码: 来自

回答 1 投票 0

如何获得多个数据框,其中一列包含另一列中元素的频率?

我有一个包含 40 个数据帧(元素)的列表“df_list”,结构如下: df_list[[1]] = 列表的第一个数据框 ID 日期 2345 2022-12-01 12:52 4234 2022-12-01 12:52 2423 202...

回答 1 投票 0

从头开始实施凝聚算法

我实现了凝聚聚类算法并正确计算了距离矩阵但是我在计算新的距离矩阵并合并后面临更新标签列表的问题...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.