尝试从 https://archive.ics.uci.edu/dataset/697/predict+students+dropout+and+academic+success
导入 zip 文件中的 csv 文件使用
df.raw=read.csv("data.csv",sep=";")
但它不断返回错误
read.table(file = file, header = header, sep = sep, quote = quote, 中出现错误: 列数多于列名
我已经尝试过了
df.raw=read.csv("data.csv",sep=";",header = FALSE)
但它只是将第一行返回为
“婚姻状况;申请方式;申请顺序;课程;“白天/晚上出勤”;以前的资格;以前的资格(等级);国籍;母亲的资格;父亲的资格;母亲的职业;父亲的职业;入学年级;流离失所;教育特殊需求;债务人;最新学费;性别;奖学金持有者;入学年龄;国际;课程单元第一学期(学分);课程单元第一学期(已注册);课程单元第一学期(评估);课程单元第一学期(批准);课程单元第一学期(年级);课程单元第一学期(无评估);课程单元第二学期(学分);课程单元第二学期(注册);课程单元第二学期(评估);课程单元第二学期(批准) );课程单元第二学期(年级);课程单元第二学期(无评估);失业率;通货膨胀率;GDP;目标;"
作为单个数据单元
我检查了你的问题,但不幸的是我无法重现你的错误,因为你的数据和代码在我这边运行顺利(使用 R 版本 4.2.1)。
但是我猜你的问题可能来自于csv.文件中“白天/晚上出勤”列名称的额外引号,这会导致你的R版本错误地处理列名称? 我没有最好的答案,只能尝试直接在 csv 文件中删除/更改它,因为我无法重现您的问题。
祝你好运!