我正在尝试将数据导入R,该数据集具有结婚率。数据集包含状态,年份(1990-2016)和年利率。但是,它没有选择正确的标题。 Year被转换为X.1,X.2,X.3,因此是第四位。它还将数字附加到州,例如阿拉巴马州为1,但是我不确定该部分是否可以固定。
链接到数据https://drive.google.com/file/d/1eLdPZKZBMDkoObl4tLemQSGTnhiAlvOT/view?usp=sharing
除了原始数据和标题年份和州以外,我已经剥离了所有文件。这是因为它没有正确读取我的xslx文件,所以我转换为csv。
> csvfile<-read.csv(file="~/Desktop/datah.csv")
> csvfile
X Year X.1 X.2 X.3 X.4 X.5 X.6
X.7
1 State 2017.0 2016.0 2015.0 2014 2013 2012.0
2011.0 2010.0
2 Alabama 7.0 7.1 7.4 7.8 7.8 8.2
8.4 8.2
3 Alaska 6.9 7.1 7.4 7.5 7.3 7.2
7.8 8.0
4 Arizona 5.8 5.9 5.9 5.8 5.4 5.6
5.7 5.9
5 Arkansas 9.5 9.9 10.0 10.1 9.8 10.9
我已经显示了前几个结果的样子。
如果您的.csv文件具有标题,请将其告诉R。请尝试:
csvfile<-read.csv(file="~/Desktop/datah.csv", header=T, sep=",")
您需要跳过第一行,因为它不包含标题:
My_data_frame <- read.csv(file="~/Desktop/datah.csv", skip = 1, stringsAsFactors = FALSE)
这也是删除stringsAsFactors自动转换的好方法。
之后最好使用dplyr整理数据。它将帮助您以后分析和绘制数据。