获得R / Java(MOA)聚类算法结果并使用python处理它们的更好方法

问题描述 投票:-2回答:1

我一直使用Python进行群集,但是最近遇到了这样一种情况,我需要同时实现CluStreamDenStream(流群集算法),可在RJava(社区中有一些Python实现,但是我已经尝试过了,他们没有用)。

问题是我必须比较许多用Python编写的聚类算法,作为上一个阶段,我使用了众所周知的scikit学习数据集(以展示算法如何处理非球形聚类-当然,我将使用时间序列数据。

现在,我想知道是否尝试这些R / Java算法并计算以Python编码的度量的正确方法DBCV),其中包含R / Java集群结果....

->因此,总而言之,我需要比较使用相同数据集(我认为可以保存到csv文件中)并计算相同有效性度量标准(用Python和R / Java编码)的许多算法。 Python)。

任何帮助将不胜感激。预先感谢!


EDIT:我遇到的解决方案如下:

  • 使用sklearn生成玩具数据集并将其持久保存到csv文件中
  • 对这些数据集使用不同的聚类算法,并将聚类结果也持久保存到csv文件中(使用哪种编程语言都没有关系)
  • 开发另一个应用程序,该应用程序:
    • 采用存储在cvs文件中的集群解决方案
    • 计算指标并显示结果

请让我知道您是否找到更好的解决方案!


[Notes

  • 此R包是我想尝试的包:streamMOA
  • 我对R一无所知,并且我以前使用过Java(我选择哪种实现取决于与Python集成的更好方法)
java python r cluster-analysis integration
1个回答
1
投票
  1. MOA是Java软件。除非您已经在R生态系统中(没有),否则没有充分的理由通过R使用它。
© www.soinside.com 2019 - 2024. All rights reserved.