嗨,我一直在尝试将数值变量重新编码为分类。
例如,使用mtcars
,我试图将mpg
分为2类<25&=> 25
这些是我尝试过的代码,但收到错误消息。
data=mtcars
summary(mtcars$mpg)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
mpgcat <- cut(mpg, breaks = (0,24.99,34), labels = c("0","1"))
错误:“mpgcat < - cut(mpg,breaks =(0,”)中的意外','
cut
将x
的范围划分为区间,并根据它们落入的区间对x中的值进行编码。最左边的间隔对应于第一级,下一个最左边对应于第二级,依此类推。
中断是两个或多个唯一切割点的数字向量或单个数字(大于或等于2),给出要切割x
的区间数。
所以你需要一些脚本代码,例如:
data=mtcars
summary(mtcars$mpg)
mpgcut <- cut(mtcars$mpg, breaks = c(0,24.99,34), labels = c("0","1"))
mpgcut
得到这样的结果:
[1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0 0 0 0
Levels: 0 1