我对研究4年内几个州的GDP感兴趣。导入.csv文件后,我重命名了列名,然后删除了不相关的行。结果是数据在编号时跳过了第十行。因此它从1变为9,然后从11开始。
[当我尝试使用从.xls文件导入的类似数据框进行此操作时,数据编号后不会跳过第10行。
gdp<-read.csv("GDP_per.csv",skip = 4) gdp<-gdp%>% rename( "2014" = X2013.2014, "2015" = X2014.2015, "2016" = X2015.2016, "2017" = X2016.2017, "2018" = X2017.2018 ) gdp<-gdp[c(-(10),-(53:64)),] gdp2<-read_excel("GDP_dol.xls", skip = 5) gdp2<-gdp2[,c(2,20:24)] gdp2<-gdp2[c(-(10),-(53:64)),]
9
特拉华州10.75.5-0.72.53.9
11佛罗里达4.96.55.04.45.8
vs。
9
特拉华州67178.970896.270379.872167.274973.310佛罗里达839706.0894044.0938370.3979464.61036323.2
我对研究4年内几个州的GDP感兴趣。导入.csv文件后,我重命名了列名,然后删除了不相关的行。结果是数据...
read.csv
函数返回一个数据帧,而read_excel
返回一个小标题。它们并不相同,并且不一定具有相同的行为方式。数据框将保留原始行名称,直到您更改它们为止,例如
(x <- data.frame(V1=1:10, V2=11:20))
(x2 <- x[-5, ]) # Row name 5 is missing
rownames(x2) <- NULL
x2 # Row names 1 - 9
[我建议您使用read_csv()
程序包中的readr
函数,将其作为小标题导入,从而导致相同的行为。