转换CSV到ARFF使用WEKA

问题描述 投票:17回答:8

我一直试图让这个数据集http://archive.ics.uci.edu/ml/datasets/Communities+and+Crime+Unnormalized到Weka中,并在所有没有运气。我把它转化为CSV,然后装成Weka中,然后试图将其转换为ARFF但仍然给我的错误"attribute names are not unique"

此外,我必须从传播测试数据集训练数据集或让他们在一起?

weka
8个回答
30
投票

您也可以使用ArffViewer(工具 - > ArffViewer或Ctrl + A)。然后打开CSV文件。

接下来转到文件 - >另存为...并选择ARFF的数据文件(默认情况下应选择)。

请注意,您的字段必须用逗号,而不是一个分号隔开。


14
投票

有在WEKA实现了一些转换器。以下是有关这一主题的API网页:http://weka.sourceforge.net/doc.stable/weka/core/converters/package-summary.html

例如,下面是如何转换CSV到ARFF:

java -cp /path/to/weka.jar weka.core.converters.CSVLoader filename.csv > filename.arff

5
投票

上传您的.csv格式文件this。从你的.csv格式将被转换为WEKA .arff格式。一旦完成取.arff文件Weka的工具。现在,您可以与您的数据分析进行。


2
投票

您需要在CSV头字段。您需要在CSV文件的第一行添加attr0,attR1位,...,标签。


1
投票

我没有任何问题。好吧,请执行下列操作。在网页的指定,

  • 复制段之间的“.arff头为秧鸡:”和‘相关论文’。
  • 贴吧上一个.txt文件
  • 打开在this location数据文件
  • 副本中的实例和追加,为您的.txt文件@data节之后
  • .txt文件保存为.arff文件

你现在好到哪里去。

我一定要分开测试数据集训练数据集或将它们放在一起?

这取决于你的分类方法。如果您选择10倍的简历,然后让他们在一起。如果你想使用的常规方法,将它们分开。同样,这一切都取决于你的方法。


0
投票

也许这网上的CSV ARFF转换器可以将有用吗?

http://slavnik.fe.uni-lj.si/markot/csv2arff/csv2arff.php


0
投票

为.csv转换为.arff文件格式Weka中使用。注意:.csv文件应该是正确的,要不然也不会转化为.arff文件。它不应该包含在列的任何空值。下载WEKA核心罐子。在Eclipse - >配置构建路径,添加的秧鸡核心罐子和编写下面一行代码并执行的代码:

CSV to A人方法.Java

import weka.core.Instances;
import weka.core.converters.ArffSaver;
import weka.core.converters.CSVLoader;

import java.io.File;

public class CSVToArff {

   public static void main(String[] args) throws Exception {


    // load CSV
    CSVLoader loader = new CSVLoader();
    loader.setSource(new File("Provide the input file location (.csv) "));
    Instances data = loader.getDataSet();

    // save ARFF
    ArffSaver saver = new ArffSaver();
    saver.setInstances(data);
    saver.setFile(new File("Provide the output file location (.arff) ");
    saver.writeBatch();
    // .arff file will be created in the output location
  }
}

-1
投票

有用

例如: - C:\用户\用户\桌面>的java -cp “E:\数据\ WEKA-3-6-10 \ weka.jar ;.” weka.core.converters.CSVLoader data1.csv >> data1.arff 1.before转换检查在Excel中的CSV作为,任何细胞的不应该是不当2.检查属性是在适当的

对于普通的csv - U必须添加标题行甚至为X,Y,Z,......根据需要

热门问题
推荐问题
最新问题