我正在尝试制作一个频率表,将值分组为有限数量的箱。
说我有数据
X <- c(1,2,3,4,3,9, 20)
我可以创建一个频率表,使其显示所有空单元格,如下所示:
(factor(X, levels = c(0:max(X))))
我没有显示每个可能值的频率,而是想要将值>5
分区,以便表格中的级别为:0, 1, 2, 3, 4, 5, and >5
。
我怎样才能做到这一点?
您首先需要转换向量以使其具有唯一条目,然后您可以在factor()
函数中添加缺少的级别:
X <- c(1,2,3,4,3,9,20)
X <- ifelse(X>5,">5",X)
X <- factor(X,levels=c(0:5,">5"))
这导致:
X [1] 1 2 3 4 3> 5> 5级别:0 1 2 3 4 5> 5
Sacha已经给你一个有效的答案,但是为了将来参考,你可能想要熟悉cut
函数,它旨在将连续变量分解为块。
x <- cut(x, c(-Inf, 0:5, Inf), labels=c(0:5, ">5"))