如何修复在 Weka 中打开 CSV 时出现的“索引越界”错误?

问题描述 投票:0回答:2

error message

我无法在weka中打开这个数据集文件 https://www.kaggle.com/datasets/parisrohan/credit-score-classification?resource=download 因为我收到此错误:索引 28 超出长度 28 的范围 在线遇到问题:378

尝试使用数据集文件和weka转换器的清理版本,但它不起作用

csv data-mining weka
2个回答
0
投票

Weka 的 CSVLoader 不喜欢连续的双引号。其他电子表格应用程序(例如 LibreOffice Calc 或 MS Excel)会在单元格内加双引号以转义它们(请参阅RFC4180,第 2.6 节)。

使其与 Weka 配合使用的最快方法是手动将这些双引号 (

""
) 替换为单引号 (
'
):

  • 使用文本编辑器(Notepad、Notepad++、vi、emacs 等)打开 CSV 文件
  • """
    替换为
    "'
    **
  • ""
    替换为
    '
  • 保存 CSV 文件

** 理论上,您需要区分单元格开头 (

,"""
->
,"'
) 和结尾 (
""",
->
'",
) 的三引号。但单元格末尾似乎没有任何三引号,因此上述方法可以工作。


0
投票

我有同样的问题,但是当我手动检查CSV文件时没有“”

© www.soinside.com 2019 - 2024. All rights reserved.