cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

将GPS数据聚类为“k”组

我有一个GPS(经度和纬度对)数据列表(~3000),我想根据它们的距离(测地线和/或欧几里德)将它们分成“k”组。最好的方法是什么?

回答 1 投票 -2

在深度学习中聚类结构化数据

是否有任何深度学习文献/参考文献在结构化数据中进行聚类?我知道可以使用Kmeans,GMM等完成。但聚类分析是否有可能......

回答 4 投票 0

在dbscan中查找值<0.1的簇

嗨我需要聚集值小于或等于0.1的点。我的用例就是这样。 0 1649.500000 1 0.864556 2 0.944651 3 0.922754 4 0.829045 5 ...

回答 2 投票 2

创建一个算法来收集差值小于给定条件值的点

嗨,我有下面给出的元组列表:[(2031,0.11078125),(2032,0.11131274999999999),(1298,0.11819950000000001),(2033,0.12396399999999999),(2030,0.13113425),(1238,0.13305375),(2886, 0 ....

回答 1 投票 -1

sklearn DBSCAN用大epsilon聚类GPS位置

我想使用sklearn的DBSCAN从我的GPS位置找到群集。我不明白为什么坐标[18.28,57.63](图中的右下角)与另一个坐在一起......

回答 2 投票 0

如何在电子邮件中查找群集

我正在做一个机器学习项目,我有一个数据集,其中包含电子邮件中发生的单词的频率。我需要找到每个邮件所属的集群。我做的是......

回答 2 投票 0

生成具有最大距离的随机集群中心

我有一个序列数据(每次一个实例)聚集成两个类。我想使用顺序版本的K-means(顺序K-means)来完成这项任务。随机指定......

回答 1 投票 1

matlab中的k-means算法给出了错误的答案?

我有以下疑问:我正在使用Matlab的k-means函数,我只想使用vanilla Lloyd的算法,以及我想要的一组初始化点。我使用以下代码,...

回答 1 投票 0

如何在Spark中选择kMean集群作为新的Dataframe

我有一个包含几百万个条目的数据框,我使用了k-Means聚类,发现一个特定的集群与其他集群有着截然不同的中心。这很有趣。我怎样才能选择......

回答 1 投票 0

如何在Python中绘制具有多个维度的大型数据集?

我正在尝试从K Means方法绘制聚类,而数据集包含一百万个具有60个维度的记录。为了获得95%的差异,我通过PCA将维数降低到35个组件......

回答 1 投票 0

K-Means距离测量 - 大数据和混合尺度

我有一个关于k-means聚类的问题。我们有一个包含120,000个观测值的数据集,需要用R计算k均值聚类解。问题是k-means通常使用欧几里德...

回答 4 投票 1

R中聚类中心与异常值之间的距离

我用R(基于kmeans)构建了一个聚类模型,并希望通过找出异常值和聚类中心之间的最小距离来对异常值进行分类。我想要的数据帧......

回答 1 投票 0

在不知道k的情况下,哪种聚类算法适用于一维列表?

我有一个像这个公共类的一维列表Zeit_und_Eigenschaft {[Feature] public double Sekunden {get;组; }} // ...列表 lzue =新名单

回答 2 投票 2

如何计算AgglomerativeClustering的准确性

嗨我在AgglomerativeClustering的python中使用样本我尝试估计性能但它切换原始标签我试图比较预测标签y_hc和原始标签y ...

回答 1 投票 0

K表示聚类不平衡数据

我有一组包含50个特征(c1,c2,c3 ......)的数据,行数超过80k。每行包含标准化数值(范围0-1)。它实际上是一个标准化的虚拟变量,有些行...

回答 1 投票 -1

使用大型数据集进行短文本聚类 - 用户概要分析

让我解释一下我想要做的事情:输入一个包含数百万行的csv文件,其中包含每一行:用户的id和包含该用户使用的关键字列表的字符串,由...分隔

回答 1 投票 1

ELKI(聚类)算法的默认参数设置

我正在研究一个研究项目,该项目涉及直观地显示许多聚类结果的结果。我看到聚类类总是带有自己的参数化器静态类。是吗 ...

回答 1 投票 0

根据空间接近度对几何点进行分组

我在3D空间中有以下几点:我需要根据D_max和d_max对点进行分组:D_max =每组的最大尺寸d_max =每组内点的最大距离像这样:...

回答 3 投票 3

Python K意味着聚类单词

我有兴趣执行k意味着聚类在一个单词列表上,距离度量为Levenshtein。 1)我知道有很多框架,包括scipy和orange有......

回答 4 投票 9

tsfresh股票数据的时间序列聚类

我们如何使用“tsfresh”进行股票数据的时间序列聚类,其中我们没有目标值向量? select_features函数需要一个目标值向量。

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.