聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。
我正在尝试使用ELKI DBSCAN聚类单词向量。我希望使用余弦距离来聚类300维的单词向量。数据集的大小为19,000个单词(19000 * 300大小矩阵)。 ...
我们需要在Qualitative_Bankruptcy数据集上用MATLAB建立一个模糊系统,我们建议在其上实现模糊聚类方法。数据集上有7个属性(6 + 1)(250 ...
我正在做一个关于Twitter用户情绪分析的项目。我正在使用K-Means算法将推文聚类成3个集群,正,负和中性。但我仍然对...感到困惑
让我们假设我们正在尝试在群集任务中对每个给定群集的数据集的每个特征的重要性进行排序。我们应该在...中衡量的特征是什么?
所以我正在使用Gower距离制作一些聚类,但我一直在尝试寻找一种特定的方法来计算变量的权重,而我还没有找到有用的东西。在......
我有大量用户的位置数据(数十万)。我存储当前位置和一些历史数据点(分钟数据返回一小时)。我该怎么办......
我有一系列值,我想使用kmeans识别具有最低值的集群。但是,群集标签似乎按照我正在寻找的不同方式进行排序。测试
我有一组N个对象,它们之间有N * N个距离。我想在子集上聚集这个集合,这样在每个集群中所有对象都具有相同的距离和平均值(cluster_size)...
我是机器学习算法的新手,我正在尝试根据新闻网站的用户点击流进行用户细分。我准备了点击流,以便我知道哪个用户ID读取...
我正致力于数据挖掘项目,以从智能仪表数据中挖掘人类活动模式。我无法找到KMeans的解决方案或如何使用KMeans算法进行群集。数据就像......
我有一个图g,我想在这个图中使用igraph找到聚类,这是我的代码:g = Graph.Read_Ncol('karate.txt',directed = False)p = g.community_label_propagation()我试图打印。 ..
在R中使用kmeans导致以下问题:kmeans中的错误(smpl $ LOAN_AMOUNT,centers = 10):比不同的数据点更多的集群中心。我提供了主要数据集的样本......
所有启发式方法,如UPGMA,能否在重复分析中提供不同的结果?
我想知道是否所有启发式方法,但具体地说,如果组没有高度定义,UPGMA或亲和传播可能在重复分析中提供不同的结果。我的意思是,作为......
此代码用于在每个群集上进行索引和排序,以识别哪些是最接近群集质心的前n个(我选择n = 6个)单词。无论如何,我发现了这种错误:'浮动'对象......
假设有五种模式,使用聚类方法,它们被分配了三个带有标签[1,1,2,1,3]的类,现在我想基于它生成一个5 * 5的关联矩阵,其中矩阵1表示它们...
我正在尝试使用Python创建地理集群(在荷兰)。我使用了HDBSCAN / hasrsine和numpy / kmeans2,但两者都得到了奇怪的结果。集群是横向的...任何想法......
我正在尝试在69列和1000行的数据帧上执行k-means。首先,我需要首先使用Davies-Bouldin指数来确定最佳簇数。这个算法......
我正在尝试用Python开发一个程序,它可以处理具有类似意图的原始聊天数据和集群句子,因此它们可以用作构建新聊天机器人的训练示例。目标是......
我对Python比较陌生,我遇到了以下问题:我试图在两个时间段内集中客户(两个不同的数据集)。 k均值聚类结果存储在...中
我正在编写一个目前包含多个DNA序列列表的脚本(每个列表都有不同数量的DNA序列),我需要根据Hamming对每个列表中的序列进行聚类...