聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。
我有兴趣执行k意味着聚类在一个单词列表上,距离度量为Levenshtein。 1)我知道有很多框架,包括scipy和orange有......
我们如何使用“tsfresh”进行股票数据的时间序列聚类,其中我们没有目标值向量? select_features函数需要一个目标值向量。
我是R的新手,我已经使用hclust训练了模型:model = hclust(distance,method =“ward”)结果看起来很好:现在我得到一些新的数据记录,我想预测哪个群集。 ..
如何计算两个树状图中两个个体之间或两个聚类方法之间的共生相似性?
如何计算两棵树内的个体(不是两棵完整的树木)之间的共生距离?我想计算每个人在两个位置内的相似性/不相似性......
假设我们使用给定的数据集训练自组织映射(SOM)。将SOM的神经元聚类而不是原始数据点是否有意义?阅读后,这个疑问来到我身边......
Mahout聚类 - 单个聚类中的所有文本向量 - 为什么?
我运行了以下示例:https://github.com/technobium/mahout-clustering/blob/master/src/main/java/com/technobium/ClusteringDemo.java#L64文档1 - > John看到一辆红色汽车。文件2 - > ......
scikitlearn - HashingVectorizer之后的MiniBatchKMeans聚类期间的内存错误
我的目标是从数百万行的数据集中执行文本聚类,其中每行是一串单词,不对应于正确的文档,而是对应于“关键字”列表。 ...
我有一个二进制字符串列表和两个不在列表中的中心字符串。我想围绕中心字符串对该列表进行分类,以便创建两个集群。一个列表的字符串......
虽然stats :: cutree()接受一个hclust-object并将其切割成给定数量的簇,但我正在寻找一个能够获取给定数量元素并尝试相应地设置k的函数。其他 ...
我正在尝试聚类时间序列的数据集。为此我计算了成对DTW距离。这些数据收集在距离矩阵中,我想用它作为输入......
如何在DBSCAN中将包含分类数据和连续数据的数据集转换为用户定义的度量函数?
我有一个具有连续和分类值的数据集。我想在DBSCAN中编写一个函数作为度量,它使用相同的欧几里德距离来连续并处理分类...
我正在尝试从sklearn中进行谱聚类,并设置最佳聚类数,我想使用本文建议的方法“自调整谱聚类”(在NIPS上发表)。 ...
我想计算亲和力传播的调整兰特指数。我有一个包含这样句子的数据集:Youtube Facebook Whatsapp打开Youtube我的亲和力传播代码如下:...
我有一个数据集,包括属于4种不同基因型的一些小鼠的每日饮水量。我正在尝试编写一个脚本,以便根据它们的模式对这些动物进行分类。
每个观察我有3个离散属性。如果对于2次观察,这些属性中至少有2个采用相同的值,那么我想将它们组合在一起(实际上总是最大的情况......
我的理解是卷积神经网络中的滤波器将提取原始数据(或前一层)中的特征,因此通过反向传播的监督学习来设计它们会使......
我正在制作一个应用程序,根据每个文档的单词/短语内容,将一组文档(数量从最少约10个文档到最多约2000个)组织成组。 ...
所以这是我的第一张地图,也是我第一次尝试编码,它是一个带有等值线的集群图,我搜索了一些方法,使其工作,我不能。这是代码行
我正在尝试为我的机器人识别星际争霸2地图中的矿物/气体区域。下图显示了我所拥有的二维阵列的图,其中1'表示矿物或气体补丁。 ...
我想找到DBSCAN的eps。我有一组点,需要计算从每个点到另一个点的距离。如果一个形状的数组是(2267436,2),那么找到附近和...