所以我使用KProtoypes聚类算法来聚类包含分类和数字列的混合变量。我收到一个错误:
'str'和'int'实例之间不支持'>'
此外,所有功能都具有一致的数据类型。我已经共享了一段代码片段,我曾用它与数据截图一起运行。我只是想集中这种类型的数据,任何关于聚类的建议都会被接受。
另外,我的数据如下:
有关数据的信息如下:
这是我为k_prototype算法编写的代码:
kp = KPrototypes(n_clusters = 3,init ='random',verbose = True) kp.fit(X_dummy,分类= [7,8,9,10,11,12,13])
另外,请检查我在kp.fit中传递的分类列表
表格中的L列包含字符串和数字(0
)。
这可能是导致错误的原因。
此消息表明,您尝试将字符串对象(str)
与整数(int)
进行比较。在应用算法之前,您需要清理数据。垃圾进来是垃圾。