我在clusim (python)文档中读到以下内容
from clusim.clustering import Clustering, print_clustering
import clusim.sim as sim
c1 = Clustering(elm2clu_dict = {0:[0], 1:[0], 2:[1], 3:[1], 4:[2], 5:[2]})
c2 = Clustering(elm2clu_dict = {0:[0], 1:[1], 2:[1], 3:[1], 4:[1], 5:[2]})
print_clustering(c1)
print_clustering(c2)
sim.jaccard_index(c1, c2)# to find similarity
但是 elm2clu_dict 是如何构造的呢?
elm2clu_dict的形式是一个元素_id映射到一个cluster_ids列表:{element_id : [cluster_id1, cluster_id2, ...]}。
你可以从你使用的任何聚类方法中创建这个字典。 请看例子文件夹中的Jupiter Notebook例子。
其他有效的聚类数据类型包括