cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

如何按长向量列对数据框进行聚类

我有一个数据框,其中有一个名为“address”的列和一个名为“vecor”的列,其中向量的长度为 700。我想按向量列对数据框进行聚类,但是当我尝试使用 KMeans 算法时...

回答 1 投票 0

如何在另一个表中显示每个簇中“kondisi”列有多少个值 1,2,3?

此图像是数据集的示例 所以我向 ChatGPT 和另一个 AI 助手询问了这个问题,但结果是 0。 这张图片是显示我想要的内容的表格 因此,从有关表格的图像中可以看出我的意思

回答 1 投票 0

根据相似性在数据库中创建行集群

我正在设计一个系统,该系统采用学生的模块,并根据他们选择的部门和科目将他们分组到班级中。 我们以下表为例: 学生卡 出发...

回答 1 投票 0

如何调整这个DBSCAN算法python

我正在使用这种聚类算法对纬度和经度点进行聚类。我正在使用 http://scikit-learn.org/stable/auto_examples/cluster/plot_dbscan.html 中给出的预先编写的代码。 代码是...

回答 2 投票 0

使用预测时“未实现这些类型的比较”

(clustMixType好像没有标签,欢迎标签建议) 我正在尝试使用库 clustMixType 来创建一些集群。 图书馆(tidyverse) 库(clustMixType) # 没有缩放或真实的d...

回答 1 投票 0

从 Spark 数据帧中提取值而不舍入该值

我正在尝试验证我的 Spark 数据集中的某些内容。我正在获取在聚类算法中使用的一组列,生成一个特征列,然后对数据进行标准化。 Spark 可以完成所有...

回答 1 投票 0

Xie-Beni 索引:Clusters-Features 1.0.3 python 库在 pip install 中不可用

我正在尝试通过以下代码使用 Clusters-Features 库中的“Xie-Beni Index”:https://pypi.org/project/Clusters-Features/: pip install 集群-功能 然而...

回答 3 投票 0

有没有办法自动分割大于某个最大点数的大簇?

我在这些坐标上运行 HDBSCAN 并得到一些簇,但有些簇太大。 HDBSCAN 有最小簇大小参数,但没有最大大小。我想要的只是直观地划分更大的簇...

回答 1 投票 0

如何进行动态聚类

我有一个表示动态图像数据的嵌套列表,每个内部列表都包含一个数字和边界框的x中心坐标。我需要聚类并获得近似的边界框x

回答 1 投票 0

python 中的 kmeans 聚类将数据垂直而不是水平分组

我有一个这样的数据集: 耦合系列 = [(9.752, 0.0005), (9.9792, 0.0008), (9.8571, 0.0036), (10.5017, 0.0038), (10.4808, 0.0038), (10.6975, 0.003), (12.1378, 0.0 008), (12.7328, 0.0005) , (14....

回答 1 投票 0

k-means聚类算法的实现

在我的程序中,我对 k-mean 算法采用 k=2,即我只需要 2 个簇。 我已经以非常简单直接的方式实现了,但我仍然无法理解为什么我的程序变得......

回答 5 投票 0

如何使用langchain FAISS进行聚类?

我正在尝试对我的 Faiss 向量进行聚类 vector_store = FAISS.load_local("embeddings_of_songs", embeddings=embeddings) 但我在谷歌上找到的只是 faiss approximation_search 我正在尝试...

回答 1 投票 0

识别代表序列对应的个体

我尝试(未成功)识别代表对应的个人 序列,使用 seqrep()。 我读了 Gabadinho, A. 和 G. Ritschard (2013),“寻找典型的生活轨迹......

回答 1 投票 0

是否有任何算法可以选择通过不同聚类分析获得的属于同一聚类的相同元素?

有一组数据通过不同的聚类算法或相同的算法但具有不同的初始参数进行聚类。例如我使用具有不同度量的层次聚类(

回答 1 投票 0

将数据集拆分为多个组/集群

我根据两列构建了以下图表: df.plot.scatter(x="queue_number", y="line_position", colormap="viridis") 我想将这些数据分组为...

回答 1 投票 0

使用python生成数据簇?

我正在开发一个Python函数,我想在其中对高斯分布进行建模,但我陷入了困境。 将 numpy.random 导入为 rnd 将 numpy 导入为 np def genData(co1, co2, M): X = rnd.randn(2, 2M + ...

回答 2 投票 0

如何从该图中使用AIC和BIC方法在K均值聚类中选择K?

我必须通过使用 AIC 和 BIC 评分方法来确定 k 来确定 Mall_Customers.csv 中的组,有 2 个变量是支出分数 (1-100) 和年收入 (k$) 在此处输入图像描述 我想要一个

回答 1 投票 0

有关在具有大量特征的大型数据集上进行聚类(和/或)降维的建议

我有一个包含 38,000 个特征和 700 万个数据点的数据集(不确定这是否相关,但很多特征都是稀疏的)。我的任务是对这些数据进行一些聚类。我以为...

回答 1 投票 0

计算簇的中心点(Python)

所以我正在运行 KNN 来创建集群。我想从每个集群中获取该集群的中心点。 我使用分数距离度量来计算距离: ...

回答 6 投票 0

如何在R中处理KML3D结果?

我使用纵向医学数据在 R 中完成了 KML3d,并在 3 个时间点测量了 2 个结果测量值(Eq5d 分数 + 牛津分数)。 预处理数据后,我使用以下代码

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.