问题,用特殊字符将管道分隔的csv读入R

问题描述 投票:0回答:1

我一直试图读取一个管道分隔的文件,该文件包含有关一些志愿者水质数据的96个变量。在文件中,随机有单引号和双引号以及分号,破折号,斜杠和可能的其他特殊字符

名称:乔纳森·乔·史密斯;杰瑞;艾米丽等

[从几个变量的输出(例如IsNewVolunteer),看来在读取数据时出现问题。 IsNewVolunteer应该始终为YN,但是出现了数字,当我查询这些行时,似乎数据正在移位。显然不是名称的变量在Firstnamelastname列中。

Shifted data columns

原始数据格式使它很难查看和排除故障,特别是由于额外的变量。我会找到一种删除它们的方法,但是R的工作目标是提供能够在经常更新的数据集上运行的代码。

Original Dataset

我已经尝试过

read.table("dnrvisualstream.csv",sep="|",stringsAsFactors = FALSE,quote="")

但是会产生以下错误:

scan中的错误(文件=文件,什么=什么,sep = sep,引用=引用,dec = dec ,:第132行没有94个元素

但是,关于第132行,我没有发现任何异常。我在]上获得了更大的成功>

read.csv("dnrvisualstream.csv",sep="|",stringsAsFactors = FALSE,quote="")

但是如上所述,仍然会产生偏移和错误。我做错了什么吗?任何信息都会有所帮助。

我一直试图读取一个由管道分隔的csv文件,该文件包含有关一些志愿者水质数据的96个变量。在文件中,随机有单引号和双引号以及...

r csv data-import
1个回答
0
投票

我认为这是两个问题之一:

© www.soinside.com 2019 - 2024. All rights reserved.